実用的なバイオオントロジー関連技術の調査

提供:TogoWiki

移動: 案内, 検索

目次

OBOの調査

Semantic Webによるデータベースの統合を見据えると、統合されたデータを柔軟に検索するのに、 オントロジーの効果的な利用が必要ではないかと考え、既存のオントロジーの調査を行った。

OBO

The Open Biological and Biomedical Ontologes [1]

ontologies provided in obo format 72
ontologies provided in owl format 14
ontologies provided in other format 2
生物種 オントロジー
アフリカツメガエル 1 xenopus_anatomy.obo
ゼブラフィッシュ 1 zebrafish_anatomy.obo
両生類 2 amphibian_anatomy.obo, amphibian_taxonomy.obo
左右相称動物 1 bilateria_mrca.obo
C.elegans 3 worm_development.obo, WBbt.obo, worm_phenotype.obo
穀草 1 plant_trait.obo
粘菌 1 dictyostelium_anatomy.obo
ショウジョウバエ 3 fly_anatomy.obo, fly_development.obo, fly_taxonomy.obo
菌類 1 dictyostelium_anatomy.obo
ヒト 15 human-dev-anat-abstract.obo, human-phenotype-ontology.obo, human-dev-anat-abstract2.obo, human_disease.obo,

human-dev-anat-staged.obo, evoc_v2.7_obo (microarrayplatform.obo, anatomicalsystem.obo, pathology.obo, associatedwith.obo, pooling.obo, celltype.obo, tissuepreparation.obo, developmentstage.obo, treatment.obo, experimentaltechnique.obo )

マウス 3 mouse_pathology.obo, adult_mouse_anatomy.obo, EMAP.obo
マラリア原虫 1 IDOMAL.obo
メダカ 1 medaka_ontology.obo
2 mosquito_anatomy.obo, mosquito_insecticide_resistance.obo
インフルエンザ 2 flu.owl
硬骨魚 2 teleost_anatomy.obo, teleost_taxonomy.obo
ダニ 1 tick_anatomy.obo
クモ 1 spider_comparative_biology.obo

OBO フォーマット

[Term] Stanza: required tags

Tag 説明 利用例
id このTermのユニークなID
name Termの名前

[Term] Stanza: optional tags

Tag 説明 利用例
is_anonymous anonymous id を持っているかどうか 使われたことがない
alt_id 別のID。複数持つことが可能
def Termの定義。複数のdefを定義するのは禁止されている。クオートされた文章と、その後に、dbxref のリストが続く。dbxrefの定義は後で。
comment Termへのコメント。複数のcommentを定義するのは禁止されている。
subset
synonym
exact_synonym
narrow_synonym
broad_synonym
xref 他の用語セット類似Termのクロスリファレンス。複数のクロスリファレンスを定義できる
xref_analog 廃止予定。xrefの別名
xref_unk 廃止予定。xrefの別名
is_a 他のTermへのis_a関係の定義。
intersection_of
union_of
disjoint_from
relationship
is_obsolete
replaced_by
consider
use_term
builtin


[Typedef] Stanza: tags

[Typedef] Stanzaは、[Term] Stanzaのタグをほとんどサポートしている。

[Term] Stanzaのタグのうち、[Typedef] Stanzaがサポートしないのは、次の3つ

union_of
instersection_of
disjoin_from

次のタグは、[Typedef] Stanza だけで利用が許可されているもの。

Tag 説明 利用例
domain
range
inverse_of
transitive_over
is_cyclic chebi.obo だけで使われている
is_reflexive
is_symmetric
is_anti_symmetric
is_transitive
is_metadata_tag

[Instance] Stanza: tags

Tag 説明 備考
id そのタームのユニークなID required tag
name そのタームの名前。ひとつしか定義できない required tag
instance_of そのインスタンスのクラス required tag
property_value optionaly tag

OBO用言語ライブラリー

For Perl

go-perl モジュール
obo フォーマットや、GO gene association フォーマットが扱える。
[ http://search.cpan.org/~cmungall/go-perl/ ]
ONTO-PERL モジュール
Cell Cycle Ontology と、OBOフォーマットを扱える。
[ http://search.cpan.org/dist/ONTO-PERL/ ]

For Ruby

BioRuby
以前のバージョンのGene Ontology 用のパーザ(by 中尾さん)は、存在するが、OBOフォーマットパーザはない

OBO Edit の使い方調査

http://oboedit.org/

新規オントロジーの構築

具体例として、OBO-Edit を用いて、すでにゲノム配列が報告されているセンモウヒラムシのオントロジーを構築を試みた。

(背景) センモウヒラムシは、海産の無脊椎動物である。系統学的位置は未確定であるが、いくつかの研究からは、 三胚葉性の生物の登場以前に分岐した系統で、刺胞動物に比較的近縁であると考えられている。 この動物について、これまでに行われた研究報告は数多くはないものの、行動や生態、細胞の形態観察などを 中心としておこなわれており、その数は少しずつふえている。いくつかの分子生物学的な手法で、重要な発生 遺伝子について機能解析がおこなわれた報告もある。が、まだまだ未知な点が多い動物である。この理由は、 一つには、ラボ内での培養系が確立されておらず、一般的な意味での分子生物学が困難であったからであると思われる。 このゲノム配列は、2009年に解読されており、したがって今後は、カスタムアレイサービスを利用した DNAマイクロアレイによる網羅的な遺伝子発現解析や、質量分析計を用いた網羅的なタンパク質解析が むしろ主流になることが予想される。

しかしながら系統学的な位置が、モデル生物から大きく離れたこの生物においては、モデル生物を主流として 作成されているGene Ontologyなどではカバーできない遺伝子機能なども多いことが想像され、このために DNAマイクロアレイなどにおいて、計算機による解析結果の解釈をする際に不便が生ずることが予想される。 たとえば具体的には、この動物にはfissionとreproductionの二種類の増殖方法が報告されているが、これに 対応する遺伝子群をマイクロアレイで解析した場合に、関連づけるオントロジーは、既存のGene Ontologyには 存在しない。また同様に、発生ステージについては、卵、小円状、64細胞期原腸胚、成熟成体などが知られているが これらについてもオントロジーが必要と考えられる。

参加者

川島秀一

川島武士