SPARQLthon44/Ortholog
提供:TogoWiki
目次 |
MBGD機能カテゴリーのRDF(オントロジー)化
オリジナルデータ
Microbial Gene Function Ontology (MGFO)
これまでの記述例
<http://mbgd.genome.ad.jp/rdf/resource/2015-01_default/cluster/3097> mbgd:funcMbgd "7.1"^^xsd:string ; mbgd:funcCog "1.1"^^xsd:string ; mbgd:funcKegg "3.1"^^xsd:string ; mbgd:funcTigr "11.1"^^xsd:string ;
オントロジーの利用
<http://mbgd.genome.ad.jp/rdf/resource/2015-01_default/cluster/3097> mgfo:hasMBGD mgfo:MBGD_7.1 ; mgfo:hasCOG mgfo:COG_1.1 ; mgfo:hasKEGG mgfo:KEGG_3.1 ; mgfo:hasTIGR mgfo:TIGR_11.1 ;
修正後
<http://mbgd.genome.ad.jp/rdf/resource/2015-01_default/cluster/3097> mgfo:funcMBGD mgfo:FuncMBGD_7.1 ; mgfo:funcCOG mgfo:FuncCOG_1.1 ; mgfo:funcKEGG mgfo:FuncKEGG_3.1 ; mgfo:funcTIGR mgfo:FuncTIGR_11.1 ;
See also
メモ
- カテゴリは、まず、限られた生物種について、遺伝子ごとに付けている
- 次に、クラスターごとに多数決をとって、付いていなかった遺伝子にも拡張して付けている
- 既存のカテゴリーを統合して、新しく設計すべきなのか
Similarityを記述するには
- similarityを記述するtermはどのようなものがあるか
- 定量的な値を記述することはできるか
SO (Sequence Ontology)
property
- obo:so_similar_to "similar_to"
- obo:so_homologous_to "homologous_to"
- obo:so_paralogous_to "paralogous_to"
- obo:so_orthologous_to "orthologous_to"
- obo:so_non_functional_homolog_of "non_functional_homolog_of" A relationship between a pseudogenic feature and its functional ancestor.
class
- obo:SO_0000856 "conserved"
- obo:SO_0000857 "homologous" Similarity due to common ancestry.
- obo:SO_0000858 "orthologous" An attribute describing a kind of homology where divergence occured after a speciation event.
- obo:SO_0000859 "paralogous" An attribute describing a kind of homology where divergence occurred after a duplication event.
- obo:SO_0000330 "conserved region" Region of sequence similarity by descent from a common ancestor.
- obo:SO_0000853 "homologous region" A region that is homologous to another region.
- obo:SO_0000854 "paralogous region" A homologous_region that is paralogous to another region.
- obo:SO_0000855 "orthologous region" A homologous_region that is orthologous to another region.
- obo:SO_0000181 "match"
- obo:SO_0000347 "nucleotide_match"
- obo:SO_0000181 "translated_nucleotide_match"
- obo:SO_0000349 "protein_match"
SIO (Semanticscience Integrated Ontology)
- sio:SIO_000283 "is similar to"
- sio:SIO_010302 "is homologous to" a relation between two entities which indicates their common ancestry.
- sio:SIO_000482 "is match to"
- sio:SIO_000484 "is exact match to"
- sio:SIO_000490 "is close match to"
- sio:SIO_000490 "is broad match to"
- sio:SIO_000558 "is orthologous to"
- sio:SIO_000630 "is paralogous to"
- sio:SIO_000634 "is xenologous to"
SKOS
- skos:exactMatch
- skos:broadMatch
- skos:narrowMatch
- skos:closeMatch
- skos:relatedMatch
RO (Relations Ontology)
- obo:RO_0002158 "shares ancestor with"
- obo:RO_0002159 "serially homologous to"
HOM (Homology Ontology)
クラス
- obo:HOM_0000000 "similarity"
- obo:HOM_0000001 "homology"
- obo:HOM_0000011 "paralogy"
- obo:HOM_0000017 "orthology"
- obo:HOM_0000018 "xenology"
- obo:HOM_0000019 "1 to 1 homology"
- obo:HOM_0000020 "1 to 1 orthology"
- obo:HOM_0000022 "ohnology" Paralogy that results from a whole genome duplication event.
- obo:HOM_0000023 "in-paralogy"
- obo:HOM_0000024 "out-paralogy"
- obo:HOM_0000034 "1 to many orthology"
- obo:HOM_0000048 "many to many orthology"
- obo:HOM_0000062 "equivalogy" Historical homology that involves functional equivalent genes with retention of the ancestral function. (This may include examples of orthology, paralogy and xenology.)
オーソログ情報と構造情報
利用法
spang ENDPOINT SPARQL PARAMETER
spang URI
利用例
コマンド
spang mbgd mbgdl:get_ortholog K9Z723 | spang uniprot uniprot_xref PDB -vac
出力
?uniprot ?xref uniprot:P74367 pdb:2KMF uniprot:P74367 pdb:2KND uniprot:Q8DG60 pdb:2Y6X
- クエリとして設定した Cyanobacterium aponinum (strain PCC 10605) のpsb27 (K9Z723) そのものの構造は得られていないが、オーソログでは構造が得られている。
- Synechocystis sp. (strain PCC 6803 / Kazusa) では、pdb:2KMF と pdb:2KND
- Thermosynechococcus elongatus (strain BP-1) では、pdb:2Y6X
コマンド
spang pdb:2KMF spang pdb:2KMF | rdf2ttl
出力
... <http://rdf.wwpdb.org/pdb/2KMF> dc:title "Solution Structure of Psb27 from cyanobacterial photosystem II" ; dcterms:identifier "2KMF" ; PDBo:datablockName "2KMF-noatom" ; PDBo:has_atom_sitesCategory <http://rdf.wwpdb.org/pdb/2KMF/atom_sitesCategory> ; ...
クエリ内容の確認
コマンド
spang mbgd mbgdl:get_ortholog K9Z723 -q
出力
DB http://sparql.nibb.ac.jp/sparql SPARQL http://mbgd.genome.ad.jp/sparql/library/get_ortholog -- PREFIX mbgdr: <http://mbgd.genome.ad.jp/rdf/resource/> PREFIX uniprot: <http://purl.uniprot.org/uniprot/> PREFIX orth: <http://purl.jp/bio/11/orth#> PREFIX mbgd: <http://purl.jp/bio/11/mbgd#> # Get orthologs in UniProt IDs #param K9Z723 SELECT ?uniprot WHERE { ?group a orth:OrthologGroup ; orth:member/orth:gene/mbgd:uniprot uniprot:K9Z723 ; orth:member/orth:gene/mbgd:uniprot ?uniprot ; orth:inDataset mbgdr:default . }
コマンド
spang uniprot uniprot_xref PDB -q
出力
DB http://sparql.uniprot.org SPARQL /mnt/lfs/home/chiba/etc/spang-0.4.2/etc/template/uniprot_xref.rq -- PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX up: <http://purl.uniprot.org/core/> PREFIX uniprot: <http://purl.uniprot.org/uniprot/> # Get cross-reference from UniProtID to other database #stdin uniprot:P74367 #param PDB SELECT ?uniprot ?xref WHERE { VALUES (?uniprot) { (uniprot:P74367) } ?uniprot rdfs:seeAlso ?xref . ?xref up:database <http://purl.uniprot.org/database/PDB> . }
コメント
- アラインメントに、アクティブサイトとかをのっけて見てみたら
- そこの違いは重要なはずなので、機能の違いを生み出していないか
- RESTで特定のエントリーの情報を問い合わせると、結果がJSON-LDで返ってきて、その結果をvisualizeできる、とか