SPARQLthon29

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
(TPP グループ全体)
(SPARQLthon グループ)
 
(間の10版分が非表示)
13行: 13行:
* [[TPP-kurokawa|ゲノム・メタゲノム情報統合による微生物DBの超高度化推進]] (黒川)
* [[TPP-kurokawa|ゲノム・メタゲノム情報統合による微生物DBの超高度化推進]] (黒川)
-
** あとで
+
** MicrobeDB.jp のインターフェイス改良 (岡別府・森)
 +
*** 検索タームが必ずしも引っかからない、もしくはデータのないスタンザが先に表示されているようなケースがある
 +
*** 検索キーワードから、ヒットのあるカテゴリや関連キーワードをサジェストし、該当するスタンザをしぼって表示するような UI
 +
*** さらに次に表示させることが可能なスタンザをサジェストする機能
* [[TPP-sugano|疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オミクスデータの統合]] (菅野)
* [[TPP-sugano|疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オミクスデータの統合]] (菅野)
** Ontop 用に[https://github.com/orenogithub/BH14.14/blob/master/ontology/ontop_dbtss.obda マッピングファイル]を作成中 (河野)
** Ontop 用に[https://github.com/orenogithub/BH14.14/blob/master/ontology/ontop_dbtss.obda マッピングファイル]を作成中 (河野)
65行: 68行:
**** 地道な作業が続いているが、方向性が見えてきた
**** 地道な作業が続いているが、方向性が見えてきた
** GGGenome の更新作業と利用規程などの整備 (内藤)
** GGGenome の更新作業と利用規程などの整備 (内藤)
 +
*** Terms of use は頻繁に変更できないため完成してから公開予定
 +
*** TogoGenome の refseq.fasta を taxonomy domain ごとに分けるほうがよいかも<br>→ http://togogenome.org/download を使うことができそう (内藤・片山)
** 昨日 (2015/2/11) リリースされた Virtuoso 7.2 の調査 (山本)
** 昨日 (2015/2/11) リリースされた Virtuoso 7.2 の調査 (山本)
*** [http://virtuoso.openlinksw.com/dataspace/doc/dav/wiki/Main/VOSNews#2015-02-11%20--%20Virtuoso%20Open-Source%20Edition%207.2.0%20Released リリースノート] によると、ついに URI 関数が実装されていた、R2RML 関連のバグ fix、マルチバイトの扱い(がよくなっているかも)
*** [http://virtuoso.openlinksw.com/dataspace/doc/dav/wiki/Main/VOSNews#2015-02-11%20--%20Virtuoso%20Open-Source%20Edition%207.2.0%20Released リリースノート] によると、ついに URI 関数が実装されていた、R2RML 関連のバグ fix、マルチバイトの扱い(がよくなっているかも)
71行: 76行:
** [[BH14.14/TogoGenome]] の続きで、insdc2ttl, jbrowse の更新など (守屋・岡別府・片山)
** [[BH14.14/TogoGenome]] の続きで、insdc2ttl, jbrowse の更新など (守屋・岡別府・片山)
*** Assembly report や SRA metadata などからリンク情報を抽出した RDF linkset を生成するフローの運用を相談した(グループ名をつける -- [[EdgeStore2.0]]) (桐山・小澤・藤澤・大田・川島・片山)
*** Assembly report や SRA metadata などからリンク情報を抽出した RDF linkset を生成するフローの運用を相談した(グループ名をつける -- [[EdgeStore2.0]]) (桐山・小澤・藤澤・大田・川島・片山)
 +
*** TogoGenome 検索結果のタブ化がほぼ完了
 +
*** TogoStanza JS 版は今月中くらいにテスト版利用可能予定
 +
*** TogoGenome で遺伝子のユニークな ID を <refseq_id>:<locus_tag|gene> にしていたが、ユニークでないことがわかったので、RDF では location も含めた内部 ID で管理し、UI としては <taxonomy_id>:<locus_tag|gene> を使うように戻す(TogoGenome/TogoStanza アプリケーションとして BioProject もしくは Assembly report の Assemble ID で切り替えてみせるようにする or UniProt の taxonomy ID が strain についてもユニークについていればそちらを使う)
 +
*** TogoGenome のテキスト検索は gene, org, env, phenotype のレポートタイプごとに検索対象のデータを SPARQL で生成しておくことに
 +
*** TogoStanza ポータルに利用する metadata.json (LD) については永野さんがドラフトを作成し、欠けているメタデータは3末をメドにスタンザ開発者が記述する
* DDBJ
* DDBJ
** [[BH14.14/genomeRDF]] の続きで、RNA-Seq の RDF 化 (藤澤)
** [[BH14.14/genomeRDF]] の続きで、RNA-Seq の RDF 化 (藤澤)
 +
*** 進捗を整理し、菅野グループと共通の RDF モデルを利用するということになった (河野・森・藤澤)
* [http://toxico.nibio.go.jp/ Open TG-GATEs]
* [http://toxico.nibio.go.jp/ Open TG-GATEs]
85行: 96行:
* [[がんゲノム]]
* [[がんゲノム]]
**  http://icgc.link/ [https://www.dropbox.com/s/15w93on6xdfu3ya/icgclink_slides.pdf?dl=0 Slide](山中 [http://kashiwanoha-marathon.com/ 募集中])
**  http://icgc.link/ [https://www.dropbox.com/s/15w93on6xdfu3ya/icgclink_slides.pdf?dl=0 Slide](山中 [http://kashiwanoha-marathon.com/ 募集中])
-
** サーバー上から JavaScript のクライアントで CONSTRUCT 結果を出力して、再度 Virtuoso にロードするスクリプト作成(完了)
+
** サーバー上の JavaScript のクライアントで '''CONSTRUCT 結果をダンプ'''して、再度 Virtuoso にロード(完了)
-
** DirectMapping定義ファイルを修正して公開に適したRDFデータセットを作成する(残念ながらここまで進まず、進捗なし)
+
*** がんゲノムプロジェクトをスクリプトで追加できるようにして、登録ドナー数を 30 から 530 まで増やした(全部で 12,000)
 +
*** 現在 530 ドナーで 18M トリプルなので、12,000 ドナーで 400M トリプル。もう少しリッチにしても 1B に満たないと推測
 +
** '''DirectMapping定義ファイルを修正'''して公開に適したRDFデータセットを作成する(残念ながらここまで進まず、進捗なし)
*** トリプル追加(class, type, domain, range)、prefix変更に伴うアプリのsparql変更
*** トリプル追加(class, type, domain, range)、prefix変更に伴うアプリのsparql変更

2015年2月13日 (金) 09:51時点における最新版

第29回 SPARQLthon を下記日程で開催したいと思います。

目次

開催概要

プロジェクト

TPP グループ全体

各データベースの該当分野とモデル図

SPARQLthon グループ

  • DBCLS
    • BH14.14/genomeRDF/RefEx の続きで RefEx の RDF 化とユースケース (小野・坊農)
      • RefEx を作成するときに捨てていた情報を拾い直して、川島さんと RDF 化するとよさそう
    • BH14.14/Docker の続きで、何を Docker 化するのがよいかユースケース (仲里・坊農)
      • RefEx で生データを公共DBから取得する際に、データの正規化を Docker コンテナ化すると透明性が確保できそう
    • BH14.14/compound の続きで、天然化合物の標準化と RDF 化 (時松)
      • 代謝産物(アルカロイド)の骨格情報の文献からの収集(継続)
      • 代謝産物(アルカロイド)の骨格情報の階層ファイルの作成(継続)
        • 地道な作業が続いているが、方向性が見えてきた
    • GGGenome の更新作業と利用規程などの整備 (内藤)
      • Terms of use は頻繁に変更できないため完成してから公開予定
      • TogoGenome の refseq.fasta を taxonomy domain ごとに分けるほうがよいかも
        http://togogenome.org/download を使うことができそう (内藤・片山)
    • 昨日 (2015/2/11) リリースされた Virtuoso 7.2 の調査 (山本)
    • BH14.14/TogoGenome の続きで、insdc2ttl, jbrowse の更新など (守屋・岡別府・片山)
      • Assembly report や SRA metadata などからリンク情報を抽出した RDF linkset を生成するフローの運用を相談した(グループ名をつける -- EdgeStore2.0) (桐山・小澤・藤澤・大田・川島・片山)
      • TogoGenome 検索結果のタブ化がほぼ完了
      • TogoStanza JS 版は今月中くらいにテスト版利用可能予定
      • TogoGenome で遺伝子のユニークな ID を <refseq_id>:<locus_tag|gene> にしていたが、ユニークでないことがわかったので、RDF では location も含めた内部 ID で管理し、UI としては <taxonomy_id>:<locus_tag|gene> を使うように戻す(TogoGenome/TogoStanza アプリケーションとして BioProject もしくは Assembly report の Assemble ID で切り替えてみせるようにする or UniProt の taxonomy ID が strain についてもユニークについていればそちらを使う)
      • TogoGenome のテキスト検索は gene, org, env, phenotype のレポートタイプごとに検索対象のデータを SPARQL で生成しておくことに
      • TogoStanza ポータルに利用する metadata.json (LD) については永野さんがドラフトを作成し、欠けているメタデータは3末をメドにスタンザ開発者が記述する
  • DDBJ
    • BH14.14/genomeRDF の続きで、RNA-Seq の RDF 化 (藤澤)
      • 進捗を整理し、菅野グループと共通の RDF モデルを利用するということになった (河野・森・藤澤)
  • がんゲノム
    • http://icgc.link/ Slide(山中 募集中
    • サーバー上の JavaScript のクライアントで CONSTRUCT 結果をダンプして、再度 Virtuoso にロード(完了)
      • がんゲノムプロジェクトをスクリプトで追加できるようにして、登録ドナー数を 30 から 530 まで増やした(全部で 12,000)
      • 現在 530 ドナーで 18M トリプルなので、12,000 ドナーで 400M トリプル。もう少しリッチにしても 1B に満たないと推測
    • DirectMapping定義ファイルを修正して公開に適したRDFデータセットを作成する(残念ながらここまで進まず、進捗なし)
      • トリプル追加(class, type, domain, range)、prefix変更に伴うアプリのsparql変更

参考リンク


参加者

  • 片山俊明 (DBCLS)
  • 川島秀一 (DBCLS)
  • 戀津魁 (理研)
  • 小澤健太郎 (SGI)
  • 伊藤真和吏 (NIBIO)12日のみ
  • 守屋勇樹(DBCLS)
  • 藤澤貴智(遺伝研)
  • 大田達郎 (DBCLS) 両日共PMのみ
  • 永野朗夫(PENQE)13日のみ
  • 時松敏明(DBCLS)12日のみ
  • 山本泰智 (DBCLS)
  • 山田一作 (野口研) 12日PM:別室にて会議
  • 坊農秀雅 (DBCLS)
  • 小野浩雅 (DBCLS) 12日のみ
  • 市原寿子 (かずさDNA研)
  • 桝屋啓志 (理研BRC)13日のみ
  • 高月照江 (理研BRC)
  • 仲里猛留(DBCLS) 12日のみ
  • 岡別府陽子(MSS)
  • 森宙史(東工大)13日のみ
  • 山本希(東工大)13日のみ
  • 櫻井望(かずさDNA研)たぶん13日にちょこっと
  • 内藤雄樹(DBCLS)
  • 木下聖子(創価大)12日のみ
  • 青木信行(創価大)12日のみ
  • 新町大輔(創価大)12日のみ
  • 中尾光輝(エーザイ)
  • 山中遼太(先端研)13日のみ
  • 山口敦子 (DBCLS)
  • 松原正陽(野口研)
  • 河野信(DBCLS)
個人用ツール