SPARQLthon26

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
(TPP グループ全体)
21行: 21行:
* [[TPP-tabata|植物ゲノム情報活用のための統合研究基盤の構築]] (田畑)
* [[TPP-tabata|植物ゲノム情報活用のための統合研究基盤の構築]] (田畑)
** 植物ゲノム情報のキュレーションの高度化 (市原)
** 植物ゲノム情報のキュレーションの高度化 (市原)
-
*** 植物の遺伝マーカーの情報を文献から収集し物理地図上にマッピングしたデータの RDF 化 → まずは、 データベースが扱う生物種情報およびRefSeq以外のゲノムデータベース情報のRDF化のために[https://docs.google.com/spreadsheets/d/1DH8H-dJKjL1q0n2GUAvXrc9JrgLB2HIQwGGmXfyN_to/edit#gid=0 スプレッドシート]で情報共有 
+
*** 植物の遺伝マーカーの情報を文献から収集し物理地図上にマッピングしたデータの RDF 化 → [[SPARQLthon26/GenomeDataSubset]]
*** 植物ごとにどのゲノム配列を使うかについて整理 → DBCLS (TogoGenome) で基盤データ整備
*** 植物ごとにどのゲノム配列を使うかについて整理 → DBCLS (TogoGenome) で基盤データ整備
** 病害キュレーションの RDF 化 (市原)
** 病害キュレーションの RDF 化 (市原)

2014年11月18日 (火) 09:04時点における版

第26回 SPARQLthon を下記日程で開催したいと思います。

目次

開催概要

プロジェクト

TPP グループ全体

  • ゲノム・メタゲノム情報統合による微生物DBの超高度化推進 (黒川)
    • 竹原さんの作った環境メタゲノムの系統組成と機能組成の比較スタンザ、菌の平均相対存在量と環境メタデータとの相関係数スタンザ、その存在量と環境メタデータについてのプロットのスタンザのデバッグ (鈴木)
      • デバッグ出来た。
      • 動かなかった原因はメタデータのキュレーションをした際にxsdでつけていたデータ型を変更したことと、RDF構造の変化によりPREFIXが変わっていた事
  • 疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オミクスデータの統合 (菅野)
    • TSS の RDF 化は込山さんが担当中
    • EBI Ensembl のバリエーション RDF と同じスキーマが利用できるかどうか検討 (河野)
  • 植物ゲノム情報活用のための統合研究基盤の構築 (田畑)
    • 植物ゲノム情報のキュレーションの高度化 (市原)
      • 植物の遺伝マーカーの情報を文献から収集し物理地図上にマッピングしたデータの RDF 化 → SPARQLthon26/GenomeDataSubset
      • 植物ごとにどのゲノム配列を使うかについて整理 → DBCLS (TogoGenome) で基盤データ整備
    • 病害キュレーションの RDF 化 (市原)
      • 適切なクラスと述語について、複数の生物種が関連して引き起こされる病気の記述方法
      • 病害抵抗遺伝子を導入したトランスジェニック植物も、複数の遺伝子を共発現させている場合にどう記述するか
      • 植物学分野でのtransgenic organismとtransgeneの取り扱いルールがあるかもしれない→要調査
        • マウスのtransgenic organismの取り扱いについて
          • 導入される度に、導入先の生物系統と導入された対立遺伝子毎にIDが新たに振られる
          • 新たにIDを振るのはキュレーター
          • 参考:http://mus.brc.riken.jp/manual/nomen_gene
        • 現在RDF化にとりかかっているのはラッカセイ(作物)-> 作物ではトランスジェニック植物の報告が結構ある
        • シロイヌナズナでの情報の蓄積がある筈なので、それを参考にするところから始める(標準化されているかは不明)
      • 発現や活性が確認されている分子にの情報について
        • 遺伝子ID, EC番号だけ, タンパク質名だけなど→EC番号からGOのIDなどを付与
          • 河野さんからTogoTableを使っての情報収集方法を教えて頂く(configurationなどの使い方, sparqlの記述の仕方)


各データベースの該当分野とモデル図

    • 国名について何を使うか (NBDC DB archive では dbpedia:country を使っている)
    • 機関名について何を使うか (NBDC DB archive では rdf:type foaf:Organization のブランクノードで表された機関に rdfs:label として持っている)
      • ナイステップ のどこかに Excel データがある (DBCLS は含まれていない)
      • JST J-GLOBAL の機関名で検索すると DBCLS も含まれており、RDF 化も進めている (櫛田)
        • RDF を公開するか金儲けするか検討中 → 公開してください。。

SPARQLthon グループ

  • SPARQL Builder
    • SWAT4LS 論文の校正 (完了、提出済)
    • 山本さんのprofilerの結果を使って動作確認をする (後で作業)
    • チュートリアルを書いていく([1] 作業中)
    • SPARQL metadataをSPARQL endpointに置く方法を決める (後で作業)
    • (実装が進めば) SPARQLthonに参加されている方に実際に使っていただいてテストと改良点のご指摘をお願いしたい
    • (余裕があれば) 試しに使ってみたいユーザのために "Try sample query" ボタンを作る
  • Lab note to RDF (Tazro, Jean-Luc)
    • LIMS + lab note + reproducibility ...
  • TogoStanza
    • togostanza.org の設計 (永野)
    • TogoStanza の機能設計みなおし (片山)
  • PubMed に出てこない文献の識別子(時松、櫛田)
    • KNApSAcK 化合物では、トータル 1200 雑誌数、このうち 150 雑誌くらいが頻出 → PubMed にあるかどうかチェック
    • カルチャーコレクションのリファレンスで PubMed にない文献情報の RDF 化

参考リンク


参加者

  • 片山俊明 (DBCLS)
  • 川島秀一 (DBCLS)
  • 小林紀郎 (理研)
  • 山口敦子 (DBCLS)
  • 守屋勇樹 (DBCLS)
  • 大田達郎 (DBCLS)
  • 山本泰智 (DBCLS)
  • 時松敏明 (DBCLS)
  • 山本 希(東工大)17日のみ
  • 鈴木真也(東工大)17日のみ
  • 永野朗夫(PENQE)17日のみ
  • 藤澤貴智(遺伝研)
  • 岡別府陽子(MSS)
  • 高月照江 (理研BRC)
  • 桝屋啓志 (理研BRC)17日のみ
  • 矢田有加里 (理研BRC)17日および18日(未定)
  • 平川英樹 (かずさ)18日のみ(予定)
  • 市原寿子 (かずさ)
  • 千葉啓和(基生研)17日のみ
  • 加藤文彦 (ROIS) 17日のみ
  • Jean-Luc Perret
  • 櫛田達矢 (NBDC)
  • 畠中秀樹 (NBDC) 18日のみ
  • 戀津魁 (理研)
個人用ツール