SPARQLthon44/Ortholog

提供:TogoWiki

移動: 案内, 検索

SPARQLthon44

目次

MBGD機能カテゴリーのRDF(オントロジー)化

オリジナルデータ

Microbial Gene Function Ontology (MGFO)

これまでの記述例

<http://mbgd.genome.ad.jp/rdf/resource/2015-01_default/cluster/3097>
    mbgd:funcMbgd    "7.1"^^xsd:string ;
    mbgd:funcCog     "1.1"^^xsd:string ;
    mbgd:funcKegg    "3.1"^^xsd:string ;
    mbgd:funcTigr   "11.1"^^xsd:string ;

オントロジーの利用

<http://mbgd.genome.ad.jp/rdf/resource/2015-01_default/cluster/3097>
    mgfo:hasMBGD mgfo:MBGD_7.1 ;
    mgfo:hasCOG  mgfo:COG_1.1 ;
    mgfo:hasKEGG mgfo:KEGG_3.1 ;
    mgfo:hasTIGR mgfo:TIGR_11.1 ;

修正後

<http://mbgd.genome.ad.jp/rdf/resource/2015-01_default/cluster/3097>
    mgfo:funcMBGD mgfo:FuncMBGD_7.1 ;
    mgfo:funcCOG  mgfo:FuncCOG_1.1 ;
    mgfo:funcKEGG mgfo:FuncKEGG_3.1 ;
    mgfo:funcTIGR mgfo:FuncTIGR_11.1 ;

See also

メモ

  • カテゴリは、まず、限られた生物種について、遺伝子ごとに付けている
  • 次に、クラスターごとに多数決をとって、付いていなかった遺伝子にも拡張して付けている


  • 既存のカテゴリーを統合して、新しく設計すべきなのか

Similarityを記述するには

  • similarityを記述するtermはどのようなものがあるか

SO (Sequence Ontology)

property

  • obo:so_similar_to "similar_to"
  • obo:so_homologous_to "homologous_to"
  • obo:so_paralogous_to "paralogous_to"
  • obo:so_orthologous_to "orthologous_to"
  • obo:so_non_functional_homolog_of "non_functional_homolog_of" A relationship between a pseudogenic feature and its functional ancestor.

class

  • obo:SO_0000856 "conserved"
  • obo:SO_0000857 "homologous" Similarity due to common ancestry.
  • obo:SO_0000858 "orthologous" An attribute describing a kind of homology where divergence occured after a speciation event.
  • obo:SO_0000859 "paralogous" An attribute describing a kind of homology where divergence occurred after a duplication event.
  • obo:SO_0000330 "conserved region" Region of sequence similarity by descent from a common ancestor.
  • obo:SO_0000853 "homologous region" A region that is homologous to another region.
  • obo:SO_0000854 "paralogous region" A homologous_region that is paralogous to another region.
  • obo:SO_0000855 "orthologous region" A homologous_region that is orthologous to another region.
  • obo:SO_0000181 "match"
  • obo:SO_0000347 "nucleotide_match"
  • obo:SO_0000181 "translated_nucleotide_match"
  • obo:SO_0000349 "protein_match"

SIO (Semanticscience Integrated Ontology)

  • sio:SIO_000283 "is similar to"
  • sio:SIO_010302 "is homologous to" a relation between two entities which indicates their common ancestry.
  • sio:SIO_000482 "is match to"
  • sio:SIO_000484 "is exact match to"
  • sio:SIO_000490 "is close match to"
  • sio:SIO_000490 "is broad match to"
  • sio:SIO_000558 "is orthologous to"
  • sio:SIO_000630 "is paralogous to"
  • sio:SIO_000634 "is xenologous to"

SKOS

  • skos:exactMatch
  • skos:broadMatch
  • skos:narrowMatch
  • skos:closeMatch
  • skos:relatedMatch

RO (Relations Ontology)

  • obo:RO_0002158 "shares ancestor with"
  • obo:RO_0002159 "serially homologous to"

HOM (Homology Ontology)

クラス

  • obo:HOM_0000000 "similarity"
  • obo:HOM_0000001 "homology"
  • obo:HOM_0000011 "paralogy"
  • obo:HOM_0000017 "orthology"
  • obo:HOM_0000018 "xenology"
  • obo:HOM_0000019 "1 to 1 homology"
  • obo:HOM_0000020 "1 to 1 orthology"
  • obo:HOM_0000022 "ohnology" Paralogy that results from a whole genome duplication event.
  • obo:HOM_0000023 "in-paralogy"
  • obo:HOM_0000024 "out-paralogy"
  • obo:HOM_0000034 "1 to many orthology"
  • obo:HOM_0000048 "many to many orthology"
  • obo:HOM_0000062 "equivalogy" Historical homology that involves functional equivalent genes with retention of the ancestral function. (This may include examples of orthology, paralogy and xenology.)

オーソログ情報と構造情報

利用法

spang ENDPOINT SPARQL PARAMETER

spang URI

利用例

コマンド

spang mbgd mbgdl:get_ortholog K9Z723 | spang uniprot uniprot_xref PDB -vac 

出力

?uniprot        ?xref
uniprot:P74367  pdb:2KMF
uniprot:P74367  pdb:2KND
uniprot:Q8DG60  pdb:2Y6X
  • クエリとして設定した Cyanobacterium aponinum (strain PCC 10605) のpsb27 (K9Z723) そのものの構造は得られていないが、オーソログでは構造が得られている。
  • Synechocystis sp. (strain PCC 6803 / Kazusa) では、pdb:2KMFpdb:2KND
  • Thermosynechococcus elongatus (strain BP-1) では、pdb:2Y6X

コマンド

spang pdb:2KMF
spang pdb:2KMF | rdf2ttl

出力

...
 <http://rdf.wwpdb.org/pdb/2KMF>
    dc:title "Solution Structure of Psb27 from cyanobacterial photosystem II" ;
    dcterms:identifier "2KMF" ;
    PDBo:datablockName "2KMF-noatom" ;
    PDBo:has_atom_sitesCategory <http://rdf.wwpdb.org/pdb/2KMF/atom_sitesCategory> ;
...

クエリ内容の確認

コマンド

spang mbgd mbgdl:get_ortholog K9Z723 -q

出力

DB      http://sparql.nibb.ac.jp/sparql
SPARQL  http://mbgd.genome.ad.jp/sparql/library/get_ortholog
--
PREFIX mbgdr: <http://mbgd.genome.ad.jp/rdf/resource/>
PREFIX uniprot: <http://purl.uniprot.org/uniprot/>
PREFIX orth: <http://purl.jp/bio/11/orth#>
PREFIX mbgd: <http://purl.jp/bio/11/mbgd#>

# Get orthologs in UniProt IDs
#param K9Z723
SELECT ?uniprot
WHERE {
    ?group a orth:OrthologGroup ;
           orth:member/orth:gene/mbgd:uniprot uniprot:K9Z723 ;
           orth:member/orth:gene/mbgd:uniprot ?uniprot ;
           orth:inDataset mbgdr:default .
}

コマンド

spang uniprot uniprot_xref PDB -q

出力

DB      http://sparql.uniprot.org
SPARQL  /mnt/lfs/home/chiba/etc/spang-0.4.2/etc/template/uniprot_xref.rq
--
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX up: <http://purl.uniprot.org/core/>
PREFIX uniprot: <http://purl.uniprot.org/uniprot/>

# Get cross-reference from UniProtID to other database
#stdin uniprot:P74367
#param PDB
SELECT ?uniprot ?xref
WHERE {
    VALUES (?uniprot) { (uniprot:P74367) }
    ?uniprot rdfs:seeAlso ?xref .
    ?xref up:database <http://purl.uniprot.org/database/PDB> .
}

コメント

  • アラインメントに、アクティブサイトとかをのっけて見てみたら
  • そこの違いは重要なはずなので、機能の違いを生み出していないか
  • RESTで特定のエントリーの情報を問い合わせると、結果がJSON-LDで返ってきて、その結果をvisualizeできる、とか
個人用ツール