BH11.11/オーソログテーブルのRDF化
提供:TogoWiki
(版間での差分)
10行: | 10行: | ||
== オーソログテーブル全体のRDF化 == | == オーソログテーブル全体のRDF化 == | ||
- | *MBGDテキストファイル形式(dclst形式)→ RDF(Turtle) | + | *MBGDテキストファイル形式(dclst形式)→ RDF(Turtle or XML) |
**変換スクリプトの作成(千葉) | **変換スクリプトの作成(千葉) | ||
MBGDテキストファイル形式(dclst形式) | MBGDテキストファイル形式(dclst形式) |
2011年11月25日 (金) 05:22時点における版
- MBGD: 内山、西出、千葉(基生研)
オーソログクラスターのRDFの試作
- サンプルRDFの作成(西出)
- RDFフォーマットの擦り合わせ(藤澤さん、片山さん、加藤さん)
- テストURI
- ブラウザにはどうやって表示するようにするか?特にSafari
http://mbgd.genome.ad.jp:8036/rdf/orthogroup/5820
- MBGD遺伝子IDとRefSeq遺伝子IDの対応表(生物種synのみに限定したサンプル) → 千葉から藤澤さんに → DBCLSでの統合
オーソログテーブル全体のRDF化
- MBGDテキストファイル形式(dclst形式)→ RDF(Turtle or XML)
- 変換スクリプトの作成(千葉)
MBGDテキストファイル形式(dclst形式)
//// Cluster 478 #CGene nrtD #CFuncMbgd 7.6 #CFuncCog 1.7 #CFuncKegg 3.1 #CFuncTigr 19 #CDescr ABC transporter ATP-binding protein #CScore 336.214 #CDist 133.476 aba:ACID345_0826 0 1 273 bsu:BSU08830 0 1 255 bsu:BSU30610 0 1 260 dra:DR_2198 0 1 248 dth:DICTH_0605 0 1 432 eco:B0366 0 1 255 eco:B0933 0 1 255 fnu:FN0235 0 1 242 fsu:FISUC_1083 0 1 271 fsu:FISUC_1097 0 1 267 ote:OTER_3561 0 1 258 rba:RB373 0 1 332 rba:RB374 0 1 281 syn:SLL1082 0 1 266 syn:SLL1452 1 1 284 syn:SLL1453 0 1 332 syn:SLR0043 1 1 282 syn:SLR0044 0 1 282 tai:TACI_0399 0 1 249 tma:TM0204 0 1 233 tma:TM0483 0 1 235 ttr:TTER_0230 0 1 275 ttr:TTER_1220 0 1 262 ttr:TTER_2227 0 1 267 tye:THEYE_A0142 0 1 430 //// Cluster 571 #CGene glnQ
RDF(Turtle)
<http://mbgd.genome.ad.jp/cluster/478> rdfs:label "ABC transporter ATP-binding protein" ; mbgd:homCluster <http://mbgd.genome.ad.jp/homcluster/1> ; mbgd:clusterScore 336.214 ; mbgd:geneSymbol "nrtD" ; mbgd:funcMbgd 7.6 ; mbgd:funcCog 1.7 ; mbgd:funcKegg 3.1 ; mbgd:funcTigr 19 ; mbgd:dist 133.476 ; mbgd:clusterMember <http://mbgd.genome.ad.jp/gene/aba:ACID345_0826/0>, <http://mbgd.genome.ad.jp/gene/bsu:BSU08830/0>, <http://mbgd.genome.ad.jp/gene/bsu:BSU30610/0>, <http://mbgd.genome.ad.jp/gene/dra:DR_2198/0>, <http://mbgd.genome.ad.jp/gene/dth:DICTH_0605/0>, <http://mbgd.genome.ad.jp/gene/eco:B0366/0>, <http://mbgd.genome.ad.jp/gene/eco:B0933/0>, <http://mbgd.genome.ad.jp/gene/fnu:FN0235/0>, <http://mbgd.genome.ad.jp/gene/fsu:FISUC_1083/0>, <http://mbgd.genome.ad.jp/gene/fsu:FISUC_1097/0>, <http://mbgd.genome.ad.jp/gene/ote:OTER_3561/0>, <http://mbgd.genome.ad.jp/gene/rba:RB373/0>, <http://mbgd.genome.ad.jp/gene/rba:RB374/0>, <http://mbgd.genome.ad.jp/gene/syn:SLL1082/0>, <http://mbgd.genome.ad.jp/gene/syn:SLL1452/1>, <http://mbgd.genome.ad.jp/gene/syn:SLL1453/0>, <http://mbgd.genome.ad.jp/gene/syn:SLR0043/1>, <http://mbgd.genome.ad.jp/gene/syn:SLR0044/0>, <http://mbgd.genome.ad.jp/gene/tai:TACI_0399/0>, <http://mbgd.genome.ad.jp/gene/tma:TM0204/0>, <http://mbgd.genome.ad.jp/gene/tma:TM0483/0>, <http://mbgd.genome.ad.jp/gene/ttr:TTER_0230/0>, <http://mbgd.genome.ad.jp/gene/ttr:TTER_1220/0>, <http://mbgd.genome.ad.jp/gene/ttr:TTER_2227/0>, <http://mbgd.genome.ad.jp/gene/tye:THEYE_A0142/0> .
- Sesameへのロード
http://localhost:8080/openrdf-workbench/repositories/mbgd9/summary
- SPARQLによる検索
- 遺伝子 "dra:DR_A0139" のオーソログを取得
select $cluster_name $gene $score $mbgd $cog $kegg $tigr $dist $org $gene_name $domain_start $domain_end where { $gene_id1 rdfs:label "dra:DR_A0139". $gene_id1 mbgd:hasDomain $domain_id1. $cluster_id mbgd:clusterMember $domain_id1. $cluster_id mbgd:clusterMember $domain_id2. $cluster_id mbgd:clusterScore $score. $cluster_id mbgd:geneSymbol $gene. $cluster_id mbgd:funcMbgd $mbgd. $cluster_id mbgd:funcCog $cog. $cluster_id mbgd:funcKegg $kegg. $cluster_id mbgd:funcTigr $tigr. $cluster_id mbgd:dist $dist. $gene_id2 mbgd:hasDomain $domain_id2. $gene_id2 mbgd:organism $org. $cluster_id rdfs:label $cluster_name. $gene_id2 rdfs:label $gene_name. $domain_id2 mbgd:domainNumber $domain_number. $domain_id2 mbgd:domainStart $domain_start. $domain_id2 mbgd:domainEnd $domain_end. }
オーソログテーブルのXML化 (OrthoXML)
- XMLファイル、スタイルシートを作成
- OrthoXML
http://orthoxml.org/0.3/orthoxml_doc_v0.3.html
- スタイルシートを利用したオーソログテーブルのRDF化(金城さん)