BH12.12/SPARQLthon2/MBGD

提供:TogoWiki

移動: 案内, 検索

SPARQLthon2

目次

RDF化

  • extended tableの情報をRDF化した
  • リソースに対して rdf:type を付加した
  • 実験的に、遺伝子IDの間をowl:sameAsでつないでみた
    • (→さまざまな遺伝子IDからの検索が、楽にできるか)

エンドポイントの設定

  • 1つのマシン上に、ポートを分けて、複数のVirtuosoを立ち上げた
  • Virtuosoを、マシン起動時に起動するようにした
  • OWLIMにOWLファイルをロードした

SPARQL検索

  • 登録ゲノム数を数える
PREFIX mbgd: <http://mbgd.genome.ad.jp:8036/rdf/rdf-schema#>

select count(*)
where {
    $s a mbgd:Genome.
}

http://sparqlbin.com/#a7b0c99de82283130698f8f0f2bef8b5


  • 登録遺伝子数を数える
PREFIX mbgd: <http://mbgd.genome.ad.jp:8036/rdf/rdf-schema#>

select count(*)
where {
    $s a mbgd:Gene.
}
  • 登録したトリプルを数える
PREFIX mbgd: <http://mbgd.genome.ad.jp:8036/rdf/rdf-schema#>

select count(*)
from <http://mbgd.genome.ad.jp:8036/rdf/genome>
from <http://mbgd.genome.ad.jp:8036/rdf/gene>
from <http://mbgd.genome.ad.jp:8036/rdf/orthogroup>
from <http://mbgd.genome.ad.jp:8036/rdf/uniprot>
from <http://mbgd.genome.ad.jp:8036/rdf/gtps>
where {
    $s $p $o.
}
  • 遺伝子"rpoB"のオーソログクラスターのメンバーを、GTPS IDで取得
PREFIX mbgd: <http://mbgd.genome.ad.jp:8036/rdf/rdf-schema#>

select $gtpsId
where {
    $cluster mbgd:gene "rpoB".
    $cluster mbgd:member $domain.
    $domain mbgd:domainOf $gene.
    $gene mbgd:gtpsId $gtpsId.
}
  • 遺伝子"rpoB"のオーソログクラスターのメンバーを、RefSeq IDで取得
PREFIX mbgd: <http://mbgd.genome.ad.jp:8036/rdf/rdf-schema#>

select $protId
where {
    $cluster mbgd:gene "rpoB".
    $cluster mbgd:member $domain.
    $domain mbgd:domainOf $gene.
    $gene mbgd:protId $protId.
}

Tips

  • VirtuosoにREST APIで問い合わせると、select文に対して最大10,000行が返された
    • virtuoso.ini の ResultsSetMaxRows で設定できるっぽい

References

SPARQL

/mw/BH12.12/SPARQLthon2/MBGD」より作成