SPARQLthon70
提供:TogoWiki
第70回 SPARQLthon を下記日程で開催したいと思います。
目次 |
開催概要
- 開催期間:2018年 7月 26(木)- 27日(金)
- 開催場所:遺伝学研究所 生命情報研究センター棟 (DDBJ棟) 4F会議室 (W403-405)
- アクセス:http://dbcls.rois.ac.jp/access
- 遺伝研行きのシャトルバスがあります。乗り口は北口から出てロータリー向かって左手です。
- 新幹線ーNIGシャトルバス接続情報
- 9:30出発のシャトルバスに乗ってお越しいただくと、DDBJ棟までご案内します。
- 関東方面からお越しの方は こだま639号 (東京8:26発、品川8:34発) がスムーズです。
- 関西方面からお越しの方は こだま632号 (名古屋7:29発) がスムーズですが、朝が早いので前泊する方が楽です。
- お昼について
- 所内には小さい食堂がありますが、売店などはありません。お弁当などをお持ち頂くことをお勧めします。
- 参考: ランチスポット情報 [三島グルメ]
- 所内には小さい食堂がありますが、売店などはありません。お弁当などをお持ち頂くことをお勧めします。
- ホテルについて
- 駅の周りのホテル
- ホテル昭明館 http://showmeikan.com/ 南口。INSDCミーティング2017で使われたホテル
- ドーミーイン http://www.hotespa.net/hotels/mishima/ 南口。トレインビュー&富士山ビュー。温泉があります
- ホテルアルファワン http://www.alpha-1.co.jp/mishima/ 南口。INSDCミーティングの時に使ってるホテルその1
- ホテルマッシモ三島 http://www.massimo-m.jp 南口。INSDCミーティングの時に使ってるホテルその2
- 東横イン http://www.toyoko-inn.com/hotel/00215/ 北口。あんまりお店がない方(北口)だけど遺伝研行きシャトルバス乗り場に近い方
- 駅の周りのホテル
スケジュール
- 7/26 (木)
- 10:00-17:00 開発
- 17:00- ラップアップ
- 18:30- 懇親会 (希望者)
- 20:25 遺伝研発三島行き最終シャトルバス
- 7/27 (金)
- 10:00-17:00 開発
- 17:00-18:00 ラップアップ
- 18:25, 19:25, 20:25 遺伝研発三島行きシャトルバス
プロジェクト
TPP グループ全体
継続中
- データサイエンスを加速させる微生物統合データベースの高度実用化開発 (黒川) - http://microbedb.jp/
- メタゲノム関連のBioSampleメタデータの整理 (森, 藤澤, 岡別府)
- BioSampleメタデータから国名および関連情報のキュレーション、まずは属性geo_loc_nameを利用してOpenRefineでバリデーション、キュレーションを試行(ユニーク値15147件中14262済, 残り885)、Wikidata Reconciliation Service API利用(藤澤)
- 糖鎖科学ポータルの構築 (木下)
- 蛋白質構造データバンクのデータ検証高度化と統合化 (栗栖) - http://pdbj.org/
- LOD Surfer API -> Protein Alignment Annotation (山口)
- Class間Pathの選択と蓄積を現在手作業で行なっているので, Class間Pathキュレーションとその保存に向けたRDF構造設計とアプリケーション作成中.アプリはまだ出来てないので今後の課題.
- 個体ゲノム時代に向けた植物ゲノム情報解析基盤の構築 (田畑) - http://pgdbj.jp/
- 疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オーミクスデータの統合 (菅野) - http://kero.hgc.jp/
- エピゲノミクス統合データベースの開発と機能拡充 (沖) - http://chip-atlas.org/
- ゲノム・疾患・医薬品のネットワークデータベース (金久) - http://www.kegg.jp/kegg/medicus/
- 物質循環を考慮したメタボロミクス情報基盤 (有田) - http://www.massbank.jp/
- MassBankとリポジトリ構築の年間計画 (有田, 櫻井, 興津, 諏訪, 小林)
- 植物メタボロミクスのメタデータ RDFグラフの検討 (櫻井, 福島, 時松, 小林, 荒)
- Virtuosoのインストール (小林)
- MassBank, Shokuhin-metabolome database (Kazusa), NCBI-Taxonomy, KNApSAcKを利用した、メタボロームデータの進化学的解析手法の開発 (川島武)
- プロテオームデータベースの機能深化と連携基盤強化(石濱)- https://jpostdb.org/
- jPOSTdb 論文書いたり、Figure 作ったり (守屋、五斗)
- 今日届いたデータに対応するためのスキーマ変更案
- peptide の下に peptide-spectrum match (PSM) があったが、peptide の下に同じ PTM, charge を持つ 'PSM group' 的なものが来て、その下に PSM が来る。でも SPARQL 書き直したくないので、今のスキーマにエッジを増やすことで対応
終了
- 生命と環境のフェノーム統合データベース (桝屋)
- 生物種メタボロームモデル・データベースの構築 (有田)
- 個別化医療に向けたヒトゲノムバリエーションデータベース (徳永)
- プロテオーム統合データベース:jPOST (石濱) - http://jpostdb.org/
- 生命動態システム科学のデータベースの統合化 (大浪)
SPARQLthon グループ
- IOBC(Interlinking Ontology for Biological Concepts)の利用例の検討(古崎,櫛田,山本,建石)
公開サイト https://bioportal.bioontology.org/ontologies/IOBC
SPARQLエンドポイント http://lod.hozo.jp/repositories/IOBC
サンプルクエリ1(RTを細分化)[1] サンプルクエリ2(RTのみ)[2]
- 新着論文レビュー係り受けコーパス (山本、建石)
- 追加分発注作業
- 形態素見直し基準に関する疑問点の解消
- 化合物名はひとまとまりにする (例: 27-ヒドロキシコレステロール)
- 名詞は1段階細分する(サ変動詞になるか、形容動詞語幹になれるか、までは見る)
- Quanto 計算パイプラインの container/CWL 化 (おおた)
- https://github.com/pitagora-galaxy/cwl/blob/master/workflows/fastqc/fastqc_wf.cwl
- `cwltool fasted_wf.cwl --nthreads 8 --run_ids SRR1274307`
- G2GML -- RDF をグラフデータベース用のデータに変換(千葉、山中)
- Sandbox をひっそり公開! http://g2g.bio/sandbox/
- コマンドライン版はこちら!
- ClinVar RDF化(佐藤)
- XML -> JSON -> データ変換のコードを自動生成
- ruby - active_supportのHash.from_xmlはelementのattributeを落としてしまう場合があり、別のxml parserを使って再度コードの生成中
- XML -> JSON -> データ変換のコードを自動生成
- D2RQ Mapper フロントエンド実装(永野)
- トリプル描画ルーチンを再帰的に使えるように書き換え
今後の予定
参考リンク
- これまでの SPARQLthon
参加者
- 片山俊明 (DBCLS)
- 川島秀一 (DBCLS)
- 大田達郎 (DBCLS)
- 守屋勇樹 (DBCLS)
- 小野浩雅 (DBCLS)
- 五斗進 (DBCLS) 26日のみ
- 岡別府陽子 (MSS)
- 山本泰智 (DBCLS)
- 山中遼太 (Oracle)
- 小林紀郎 (RIKEN)
- 仲里猛留 (DBCLS)
- 坊農秀雅 (DBCLS)
- 大石直哉 (dogrun)
- 櫛田達矢(NBDC)26日15時から
- 古崎晃司(大阪大学)26日のみ
- 山口敦子 (DBCLS)
- 佐藤大輔(Lifematics)
- 田中聡 (Trans-IT)
- 永野朗夫(penqe)
- 森宙史(遺伝研)
- 福島敦史(RIKEN)27日のみ
- 櫻井望(遺伝研)
- 興津哲也(axiohelix)
- 諏訪和大(liorect)
- 建石由佳(NBDC)26日15時から
- 千葉啓和 (DBCLS)
- 有田正規(遺伝研)
- 藤澤貴智(遺伝研)
- 望月孝子(遺伝研)
- 川島武士 (遺伝研)
- 荒武 (京都大学) 27日のみ
- 時松敏明(DDBJ)