BH12.12/SPARQLthon8/MBGD

提供:TogoWiki

移動: 案内, 検索

SPARQLthon8

目次

サーバー整備

ファイル設置


エンドポイント

http://sparql.nibb.ac.jp/sparql

graph名 内容 rule set名
http://mbgd.genome.ad.jp/rdf/2013-01/default.ttl オーソロググループの情報(MBGD default cluster)
http://mbgd.genome.ad.jp/rdf/2013-01/gene.ttl 遺伝子に関する情報
http://mbgd.genome.ad.jp/rdf/2013-01/genome.ttl 生物種に関する情報
http://mbgd.genome.ad.jp/rdf/2013-01/chromosome.ttl Chromosome, Plasmidに関する情報
http://mbgd.genome.ad.jp/rdf/2013-01/uniprot.ttl UniProt IDの参照
http://mbgd.genome.ad.jp/rdf/2013-01/ortholog.owl Ortholog Ontology ortholog
http://mbgd.genome.ad.jp/rdf/2013-01/mbgd.owl MBGD Ontology mbgd
http://mbgd.genome.ad.jp/rdf/2013-01/core.owl UniProt properties and classes uniprot
http://mbgd.genome.ad.jp/rdf/2013-01/taxonomy.rdf NCBI taxonomy (RDF from UniProt) taxonomy


Virtuosoバージョンアップ

  • Virtuoso Ver.7 Open-Source版
    • ロード時間
サイズ(トリプル) ロード時間(msec) 秒/Mトリプル
default.ttl 31,733,989 3,224,581 101.6
gene.ttl 105,595,684 9,301,891 88.1


  • Virtuoso Ver.7 Commercial版

オントロジー

mbgd.owl

Mbgd.png


関連するオントロジーがあれば、置き換えたり、関連づけたりしていきたい。

  • OGO: an ontological approach for integrating knowledge about orthology
  • CDAO: Comparative Data Analysis Ontology
  • FALDO: Feature Annotation Location Description Ontology

Stanza作成

オーソログ(Protein→Protein: protein_ortholog)

例:UniProt ID P00934 のオーソログ

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX orth: <http://mbgd.genome.ad.jp/owl/ortholog.owl#>
PREFIX mbgd: <http://mbgd.genome.ad.jp/owl/mbgd.owl#>
PREFIX mbgdCluster: <http://mbgd.genome.ad.jp/rdf/cluster/2013-01/>
PREFIX uniprotProtein: <http://purl.uniprot.org/uniprot/>

SELECT ?uniprot
WHERE {
    mbgdCluster:default orth:member ?group .
    ?group a orth:OrthologGroup ;
           orth:member ?member ;
           orth:member ?member2 .
    ?member orth:geneId ?gene .
    ?gene rdfs:seeAlso ?uniprot .
    ?uniprot a mbgd:UniprotId .
    ?member2 orth:geneId ?gene2 .
    ?gene2 rdfs:seeAlso uniprotProtein:P00934 .
}

http://bias.nibb.ac.jp:3001/ortholog?tax_id=1111708&gene_id=slr1311

オーソログを持っている系統群(Gene→Taxon: ortholog_taxon_profile)

例:P00934 (UniProt ID)のオーソログを持つ生物が属する科。(各科に属する生物の数でソート)

Familyを、Class, Order, Genusに変えれば、別のrankで集計できる。

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX orth: <http://mbgd.genome.ad.jp/owl/ortholog.owl#>
PREFIX mbgd: <http://mbgd.genome.ad.jp/owl/mbgd.owl#>
PREFIX mbgdCluster: <http://mbgd.genome.ad.jp/rdf/cluster/2013-01/>
PREFIX uniprot: <http://purl.uniprot.org/core/>
PREFIX uniprotProtein: <http://purl.uniprot.org/uniprot/>

SELECT ?family ?name COUNT(?organism) AS ?count
WHERE {
    mbgdCluster:default orth:member ?group .
    ?group a orth:OrthologGroup ;
           orth:member ?member ;
           orth:member ?member2 .
    ?member orth:organism ?organism .
    ?organism orth:taxonomy ?tax .
    ?tax rdfs:subClassOf ?family option (transitive) .
    ?family uniprot:rank uniprot:Family ;
            uniprot:scientificName ?name .
    ?member2 orth:geneId ?gene2 .
    ?gene2 rdfs:seeAlso uniprotProtein:P00934 .
} ORDER BY DESC (?count)

http://bias.nibb.ac.jp:3001/taxonomy_ortholog?gene_id=slr1311 [1]

特定の系統群が共通して持っているオーソログ(Taxon→Gene: taxon_ortholog_profile)

全てに共通する遺伝子のみを考えることもできるし、少なくとも一つの生物にあるものすることもできる。

ここでは、もっている生物の数でソートした。

例:Taxonomy ID 543(Enterobacteriaceae; 腸内細菌科)が共通して持っているオーソログ。(持っている生物の数でソート)

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX orth: <http://mbgd.genome.ad.jp/owl/ortholog.owl#>
PREFIX mbgd: <http://mbgd.genome.ad.jp/owl/mbgd.owl#>
PREFIX mbgdCluster: <http://mbgd.genome.ad.jp/rdf/cluster/2013-01/>
PREFIX uniprotTax: <http://purl.uniprot.org/taxonomy/>

SELECT ?group ?comment COUNT(?organism) AS ?count
WHERE {
    mbgdCluster:default orth:member ?group .
    ?group a orth:OrthologGroup ;
           rdfs:comment ?comment ;
           orth:member ?member .
    ?member orth:organism ?organism .
    ?organism orth:taxonomy ?tax .
    ?tax rdfs:subClassOf uniprotTax:543 option (transitive) .
} ORDER BY DESC (?count)
個人用ツール