TPP-oki
提供:TogoWiki
目次 |
メンバー
おおた (DBCLS)
課題
- ChIP-Atlas (http://chip-atlas.org) に収載されたデータのRDF化
- 収録データ
- bigWig, bed などのピークコールのデータ
- Target gene analysis のデータ
- Co-localization のデータ
- キュレーションされたメタデータ (転写因子名、細胞株名)
- 関連データ
- SRA, BioSample に登録されたメタデータ
- Quanto で公開されているシーケンスクオリティ (base call accuracy) のデータ
- 収録データ
活動ログ
2017/05
- RDF化データの優先順位づけ
- メタデータ → 解析データ → 生データ のような優先順位でやっていきます
- BioSample/BioProject/SRA メタデータのRDF化
- オントロジーは既に理研桝屋グループ (小林さん) が作ってくれたものを使う
- SRAは機械的に変換できそう, コンバータ実装中
- BioSample の attribute が曲者 (key=value形式で user defined keyもある表記ゆれ地獄) なので、優先する attribute を決めて全部はやらない
- 差し当たっては cell line と antibody のフィールドが必須なのでここだけ変換する
- これらをなんらかのオントロジーに当てる件については調査中、既にやってるグループがあるっぽい?
- 差し当たっては cell line と antibody のフィールドが必須なのでここだけ変換する
2017/04
- 肝になるサンプル情報のRDF化から進めていく
- キュレーションされたメタデータをZoomaでオントロジーマッピングしてみたが、当たらないものも結構ある。何が当たらないのか、どんなオントロジーがあればいいのかを検討してみよう。
- bigWig, bed をRDFize するときは菅野Gと合わせるようにする
- 川島さんと相談しつつ