BH11.11/オーソログテーブルのRDF化

提供:TogoWiki

2011年11月25日 (金) 05:37時点におけるChi (トーク | 投稿記録)による版
移動: 案内, 検索
  • MBGD: 内山、西出、千葉(基生研)

オーソログクラスターのRDFの試作

http://mbgd.genome.ad.jp:8036/rdf/orthogroup/5820
  • MBGD遺伝子IDとRefSeq遺伝子IDの対応表(生物種synのみに限定したサンプル) → 千葉から藤澤さんに → DBCLSでの統合

オーソログテーブル全体のRDF化

  • MBGDテキストファイル形式(dclst形式)→ RDF(XML形式 or Turtle形式)
    • 変換スクリプトの作成(千葉)

MBGDテキストファイル形式(dclst形式)

////
Cluster 478
#CGene	nrtD
#CFuncMbgd	7.6
#CFuncCog	1.7
#CFuncKegg	3.1
#CFuncTigr	19
#CDescr	ABC transporter ATP-binding protein
#CScore	336.214
#CDist	133.476
aba:ACID345_0826	0	1	273
bsu:BSU08830	0	1	255
bsu:BSU30610	0	1	260
dra:DR_2198	0	1	248
dth:DICTH_0605	0	1	432
eco:B0366	0	1	255
eco:B0933	0	1	255
fnu:FN0235	0	1	242
fsu:FISUC_1083	0	1	271
fsu:FISUC_1097	0	1	267
ote:OTER_3561	0	1	258
rba:RB373	0	1	332
rba:RB374	0	1	281
syn:SLL1082	0	1	266
syn:SLL1452	1	1	284
syn:SLL1453	0	1	332
syn:SLR0043	1	1	282
syn:SLR0044	0	1	282
tai:TACI_0399	0	1	249
tma:TM0204	0	1	233
tma:TM0483	0	1	235
ttr:TTER_0230	0	1	275
ttr:TTER_1220	0	1	262
ttr:TTER_2227	0	1	267
tye:THEYE_A0142	0	1	430
////
Cluster 571
#CGene	glnQ

RDF/XML - 遺伝子のグルーピングの情報のみ

 <rdf:Description rdf:about="http://mbgd.genome.ad.jp/rdf/orthogroup/478">
  <rdfs:label>ABC transporter ATP-binding protein</rdfs:label>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/aba:ACID345_0826"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/bsu:BSU08830"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/bsu:BSU30610"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/dra:DR_2198"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/dth:DICTH_0605"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/eco:B0366"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/eco:B0933"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/fnu:FN0235"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/fsu:FISUC_1083"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/fsu:FISUC_1097"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/ote:OTER_3561"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/rba:RB373"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/rba:RB374"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/syn:SLL1082"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/syn:SLL1452"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/syn:SLL1453"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/syn:SLR0043"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/syn:SLR0044"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/tai:TACI_0399"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/tma:TM0204"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/tma:TM0483"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/ttr:TTER_0230"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/ttr:TTER_1220"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/ttr:TTER_2227"/>
  <rdfs:member rdf:resource="http://mbgd.genome.ad.jp/rdf/gene/tye:THEYE_A0142"/>
</rdf:Description>

RDF(Turtle形式) - 遺伝子のグルーピングの情報のみ

<http://mbgd.genome.ad.jp/rdf/orthogroup/478> rdfs:label "ABC transporter ATP-binding protein" ;
   rdfs:member <http://mbgd.genome.ad.jp/rdf/gene/ttr:TTER_2227>,
       <http://mbgd.genome.ad.jp/rdf/gene/ttr:TTER_1220>,
       <http://mbgd.genome.ad.jp/rdf/gene/syn:SLL1452>,
       <http://mbgd.genome.ad.jp/rdf/gene/eco:B0366>,
       <http://mbgd.genome.ad.jp/rdf/gene/tma:TM0483>,
       <http://mbgd.genome.ad.jp/rdf/gene/tai:TACI_0399>,
       <http://mbgd.genome.ad.jp/rdf/gene/rba:RB373>,
       <http://mbgd.genome.ad.jp/rdf/gene/dth:DICTH_0605>,
       <http://mbgd.genome.ad.jp/rdf/gene/ote:OTER_3561>,
       <http://mbgd.genome.ad.jp/rdf/gene/aba:ACID345_0826>,
       <http://mbgd.genome.ad.jp/rdf/gene/tma:TM0204>,
       <http://mbgd.genome.ad.jp/rdf/gene/tye:THEYE_A0142>,
       <http://mbgd.genome.ad.jp/rdf/gene/bsu:BSU08830>,
       <http://mbgd.genome.ad.jp/rdf/gene/ttr:TTER_0230>,
       <http://mbgd.genome.ad.jp/rdf/gene/bsu:BSU30610>,
       <http://mbgd.genome.ad.jp/rdf/gene/syn:SLR0043>,
       <http://mbgd.genome.ad.jp/rdf/gene/eco:B0933>,
       <http://mbgd.genome.ad.jp/rdf/gene/fsu:FISUC_1083>,
       <http://mbgd.genome.ad.jp/rdf/gene/dra:DR_2198>,
       <http://mbgd.genome.ad.jp/rdf/gene/syn:SLL1082>,
       <http://mbgd.genome.ad.jp/rdf/gene/fnu:FN0235>,
       <http://mbgd.genome.ad.jp/rdf/gene/fsu:FISUC_1097>,
       <http://mbgd.genome.ad.jp/rdf/gene/syn:SLR0044>,
       <http://mbgd.genome.ad.jp/rdf/gene/rba:RB374>,
       <http://mbgd.genome.ad.jp/rdf/gene/syn:SLL1453> .

RDF(Turtle形式) - 元のdclst形式のテキストファイルに含まれている様々な情報を全て含む

<http://mbgd.genome.ad.jp/cluster/478> rdfs:label "ABC transporter ATP-binding protein" ;
 mbgd:homCluster <http://mbgd.genome.ad.jp/homcluster/1> ;
 mbgd:clusterScore 336.214 ;
 mbgd:geneSymbol "nrtD" ;
 mbgd:funcMbgd 7.6 ;
 mbgd:funcCog 1.7 ;
 mbgd:funcKegg 3.1 ;
 mbgd:funcTigr 19 ;
 mbgd:dist 133.476 ;
 mbgd:clusterMember <http://mbgd.genome.ad.jp/gene/aba:ACID345_0826/0>,
          <http://mbgd.genome.ad.jp/gene/bsu:BSU08830/0>,
          <http://mbgd.genome.ad.jp/gene/bsu:BSU30610/0>,
          <http://mbgd.genome.ad.jp/gene/dra:DR_2198/0>,
          <http://mbgd.genome.ad.jp/gene/dth:DICTH_0605/0>,
          <http://mbgd.genome.ad.jp/gene/eco:B0366/0>,
          <http://mbgd.genome.ad.jp/gene/eco:B0933/0>,
          <http://mbgd.genome.ad.jp/gene/fnu:FN0235/0>,
          <http://mbgd.genome.ad.jp/gene/fsu:FISUC_1083/0>,
          <http://mbgd.genome.ad.jp/gene/fsu:FISUC_1097/0>,
          <http://mbgd.genome.ad.jp/gene/ote:OTER_3561/0>,
          <http://mbgd.genome.ad.jp/gene/rba:RB373/0>,
          <http://mbgd.genome.ad.jp/gene/rba:RB374/0>,
          <http://mbgd.genome.ad.jp/gene/syn:SLL1082/0>,
          <http://mbgd.genome.ad.jp/gene/syn:SLL1452/1>,
          <http://mbgd.genome.ad.jp/gene/syn:SLL1453/0>,
          <http://mbgd.genome.ad.jp/gene/syn:SLR0043/1>,
          <http://mbgd.genome.ad.jp/gene/syn:SLR0044/0>,
          <http://mbgd.genome.ad.jp/gene/tai:TACI_0399/0>,
          <http://mbgd.genome.ad.jp/gene/tma:TM0204/0>,
          <http://mbgd.genome.ad.jp/gene/tma:TM0483/0>,
          <http://mbgd.genome.ad.jp/gene/ttr:TTER_0230/0>,
          <http://mbgd.genome.ad.jp/gene/ttr:TTER_1220/0>,
          <http://mbgd.genome.ad.jp/gene/ttr:TTER_2227/0>,
          <http://mbgd.genome.ad.jp/gene/tye:THEYE_A0142/0> .
  • Sesameへのロード
http://localhost:8080/openrdf-workbench/repositories/mbgd9/summary
  • SPARQLによる検索
    • 遺伝子 "dra:DR_A0139" のオーソログを取得
select $cluster_name $gene $score $mbgd $cog $kegg $tigr $dist $org $gene_name $domain_start $domain_end where {
$gene_id1 rdfs:label "dra:DR_A0139".
$gene_id1 mbgd:hasDomain $domain_id1.
$cluster_id mbgd:clusterMember $domain_id1.
$cluster_id mbgd:clusterMember $domain_id2.
$cluster_id mbgd:clusterScore $score.
$cluster_id mbgd:geneSymbol $gene.
$cluster_id mbgd:funcMbgd $mbgd.
$cluster_id mbgd:funcCog $cog.
$cluster_id mbgd:funcKegg $kegg.
$cluster_id mbgd:funcTigr $tigr.
$cluster_id mbgd:dist $dist.
$gene_id2 mbgd:hasDomain $domain_id2.
$gene_id2 mbgd:organism $org.
$cluster_id rdfs:label $cluster_name.
$gene_id2 rdfs:label $gene_name.
$domain_id2 mbgd:domainNumber $domain_number.
$domain_id2 mbgd:domainStart $domain_start.
$domain_id2 mbgd:domainEnd $domain_end.
}

オーソログテーブルのXML化 (OrthoXML)

  • XMLファイル、スタイルシートを作成
  • OrthoXML
http://orthoxml.org/0.3/orthoxml_doc_v0.3.html
  • スタイルシートを利用したオーソログテーブルのRDF化(金城さん)
個人用ツール