BH11.11/ヒト・環境メタゲノムメタデータのオントロジー整備とRDF化

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
(将来的な連携?)
(進め方)
38行: 38行:
*** カテゴリーのピックアップ (済) → ファイル共有
*** カテゴリーのピックアップ (済) → ファイル共有
*** カテゴリ内の値を取る (済) → ファイル共有
*** カテゴリ内の値を取る (済) → ファイル共有
-
*** Habitatに関する38カテゴリは、サンプル内でそれらをまとめて1-2の大きなHabitatカテゴリとしてしまっても問題は無さそう。-mri
+
*** Habitatに関するカテゴリーは38カテゴリー
-
*** サンプルごとにEnvOへのマッピングを検討中 -mri
+
*** カテゴリー名の表記ゆれの個別の値、サンプルIDをトレースできるようにする
*** カテゴリー名の表記ゆれの個別の値、サンプルIDをトレースできるようにする
** Test (例)の設計重要 -kim
** Test (例)の設計重要 -kim

2011年11月22日 (火) 13:55時点における版

目次

目標

  • ヒトメタゲノム・環境メタゲノムのメタデータの内容を整理し、既存の制御語彙もしくはオントロジーと対応付ける方法を考える
  • 上記で設計した手法を実際のデータに適用しRDFデータをつくる

今回の議題

  • メタデータCategory内容について -mri
    • 統計値: どのような内容のデータがいくつくらいあるか
      • ヒトメタゲノム 7万サンプル 85 カテゴリー
      • 環境メタゲノム 4054サンプル 627 カテゴリー
    • マニュアルキュレーション出来そうなカテゴリー項目の選定
    • sanger(DDBJ FlatFile)の内容を検討 -kmn
  • オントロジーとの対応 -so, yy, kwsm
  • マッピング手法の調査選定とプロトタイピング -so, yy, kwsm
  • NBRC菌株メタデータの整理 -sgw
    • 分離源、培地情報の整理とRDF設計

進め方

  • メタデータのどのカテゴリーを対象とするか
    • 環境メタゲノムの生育場所に関連する情報を対象にする
  • マッピング作業の設計
    • predicateの選定 - so, kwsm, yy, kim
    • カテゴリー名の名寄せ
      • カテゴリーのピックアップ (済) → ファイル共有
      • カテゴリ内の値を取る (済) → ファイル共有
      • Habitatに関するカテゴリーは38カテゴリー
      • カテゴリー名の表記ゆれの個別の値、サンプルIDをトレースできるようにする
    • Test (例)の設計重要 -kim
  • 作業設計のまとめ
    • 利用ボキャブラリー, オントロジー, predicate, を元に作業マニュアルを共有
  • 作業分担

関連・支流

  • BioProject, BioSample ヒアリング (神沼さん)
    • DDBJ(GenBank flatfile)のENV divisionデータの整理:

     Release 87.0(2011/9版) SOURCE /isolation_source, Accession数=約370万, ユニークタグ数=18,428



将来的な連携?

  • メタデータによる各機関のリソース連携案 -kmn

Ek hackathon1.PNG


途中経過ファイル

  • 2011/11/22

メンバー (所属) 興味

  • 菅原先生 (DDBJ) 培地・分離源情報のRDF化 [sgw]
  • 重元さん (DDBJ) GTPS, 各種RDF化
  • 大田さん (DBCLS) SRAメタデータ整理 NGSデータ整理
  • 内藤さん (DBCLS) "GGRNA"高速配列検索, RNA配列, DNA配列
  • 岡本 (DBCLS) アノテーション, キュレーション, 微生物ゲノム [so]
  • 内山先生 (NIBB) オーソログ分類→メタゲノム, MBGD
  • 西出さん (NIBB) MBGD開発実務
  • 千葉さん (NIBB) MBGD開発実務, 微生物統合プロジェクト
  • 川島さん (HGC) ゲノム環境オントロジー, LinkDB RDF化 [kwsm]
  • 山本さん (DBCLS) Text Mining, 表記ゆれの吸収など [yy]
  • 神沼さん (DDBJ) DRA, DTA, DOR/CIBEX, BioSample, BioProject [kmn]
  • 森さん (東工大) メタゲノム比較, microbe.jp, 微生物統合プロジェクト [mri]
  • 竹原さん (東工大) メタゲノム比較, 微生物統合プロジェクト
  • 吉野さん (東工大) メタゲノム比較, 微生物統合プロジェクト
  • 後藤さん (阪大) 病原菌メタゲノム, OpenBio

個人用ツール