TPP-oki
提供:TogoWiki
(版間での差分)
		
		
|  (→活動ログ) |  (→活動ログ) | ||
| 16行: | 16行: | ||
| == 活動ログ == | == 活動ログ == | ||
| + | |||
| + | ===2017/05 === | ||
| + | |||
| + | * RDF化データの優先順位づけ | ||
| + | ** メタデータ → 解析データ → 生データ のような優先順位でやっていきます | ||
| + | * BioSample/BioProject/SRA メタデータのRDF化 | ||
| + | ** オントロジーは既に理研桝屋グループ (小林さん) が作ってくれたものを使う | ||
| + | ** SRAは機械的に変換できそう, コンバータ実装中 | ||
| + | ** BioSample の attribute が曲者 (key=value形式で user defined keyもある表記ゆれ地獄) なので、優先する attribute を決めて全部はやらない | ||
| + | *** 差し当たっては cell line と antibody のフィールドが必須なのでここだけ変換する | ||
| + | **** これらをなんらかのオントロジーに当てる件については調査中、既にやってるグループがあるっぽい? | ||
| === 2017/04 === | === 2017/04 === | ||
2017年5月16日 (火) 08:54時点における最新版
| 目次 | 
メンバー
おおた (DBCLS)
課題
-  ChIP-Atlas (http://chip-atlas.org) に収載されたデータのRDF化
-  収録データ
- bigWig, bed などのピークコールのデータ
- Target gene analysis のデータ
- Co-localization のデータ
- キュレーションされたメタデータ (転写因子名、細胞株名)
 
- 関連データ
- SRA, BioSample に登録されたメタデータ
- Quanto で公開されているシーケンスクオリティ (base call accuracy) のデータ
 
 
-  収録データ
活動ログ
2017/05
-  RDF化データの優先順位づけ
- メタデータ → 解析データ → 生データ のような優先順位でやっていきます
 
-  BioSample/BioProject/SRA メタデータのRDF化
- オントロジーは既に理研桝屋グループ (小林さん) が作ってくれたものを使う
- SRAは機械的に変換できそう, コンバータ実装中
-  BioSample の attribute が曲者 (key=value形式で user defined keyもある表記ゆれ地獄) なので、優先する attribute を決めて全部はやらない
-  差し当たっては cell line と antibody のフィールドが必須なのでここだけ変換する
- これらをなんらかのオントロジーに当てる件については調査中、既にやってるグループがあるっぽい?
 
 
-  差し当たっては cell line と antibody のフィールドが必須なのでここだけ変換する
 
2017/04
-  肝になるサンプル情報のRDF化から進めていく
- キュレーションされたメタデータをZoomaでオントロジーマッピングしてみたが、当たらないものも結構ある。何が当たらないのか、どんなオントロジーがあればいいのかを検討してみよう。
 
-  bigWig, bed をRDFize するときは菅野Gと合わせるようにする
- 川島さんと相談しつつ
 

