TPP-oki

提供:TogoWiki

移動: 案内, 検索

目次

メンバー

おおた (DBCLS)

課題

  • ChIP-Atlas (http://chip-atlas.org) に収載されたデータのRDF化
    • 収録データ
      • bigWig, bed などのピークコールのデータ
      • Target gene analysis のデータ
      • Co-localization のデータ
      • キュレーションされたメタデータ (転写因子名、細胞株名)
    • 関連データ
      • SRA, BioSample に登録されたメタデータ
      • Quanto で公開されているシーケンスクオリティ (base call accuracy) のデータ

活動ログ

2017/05

  • RDF化データの優先順位づけ
    • メタデータ → 解析データ → 生データ のような優先順位でやっていきます
  • BioSample/BioProject/SRA メタデータのRDF化
    • オントロジーは既に理研桝屋グループ (小林さん) が作ってくれたものを使う
    • SRAは機械的に変換できそう, コンバータ実装中
    • BioSample の attribute が曲者 (key=value形式で user defined keyもある表記ゆれ地獄) なので、優先する attribute を決めて全部はやらない
      • 差し当たっては cell line と antibody のフィールドが必須なのでここだけ変換する
        • これらをなんらかのオントロジーに当てる件については調査中、既にやってるグループがあるっぽい?

2017/04

  • 肝になるサンプル情報のRDF化から進めていく
    • キュレーションされたメタデータをZoomaでオントロジーマッピングしてみたが、当たらないものも結構ある。何が当たらないのか、どんなオントロジーがあればいいのかを検討してみよう。
  • bigWig, bed をRDFize するときは菅野Gと合わせるようにする
    • 川島さんと相談しつつ
個人用ツール