BH12.12/INSDCオントロジー
提供:TogoWiki
目次 |
目的
INSDC配列エントリー(Genbank, EMBL, DDBJ 形式)のRDF化のためのオントロジー開発
事前準備
- INSDCエントリー周辺情報の調査(2012年8月〜)
- プロトタイプ作成 (2012年12月12日〜)
BH12.12での作業
- Feature Table Definition version 10.2をOWLで定義する。
- featureをclassとして定義する 【Done】
- qualiferをdatatype propertyとして定義する【Done】
- Controlled vocabularyをdata propertyのrangeもしくはIndividualsとして定義する【Done】
- feature-qualifer間の関係情報をdata propertyのdomainで定義する【Done】
- mandatory, optional qualifierをclassの制約クラスで定義する【Todo】
- feature の Molecular scope, Organisim scopeを定義する【Todo】
例) Feature: Assembly_Gap
<http://insdc.org/owl/Assembly_Gap> a owl:Class ; rdfs:comment "gap between two components of a CON record that is part of a genome assembly;" ; rdfs:label "assembly_gap" ; rdfs:subClassOf <http://insdc.org/owl/Feature> ; owl:equivalentClass [ a owl:Restriction ; owl:cardinality "1"^^xsd:nonNegativeInteger ; owl:onProperty <http://insdc.org/owl/estimated_length> ], [ a owl:Restriction ; owl:cardinality "1"^^xsd:nonNegativeInteger ; owl:onProperty <http://insdc.org/owl/gap_type> ] . [] a owl:Axiom ; rdfs:label <http://insdc.org/owl/MandatoryQualifiers> ; owl:annotatedProperty owl:equivalentClass ; owl:annotatedSource <http://insdc.org/owl/Assembly_Gap> ; owl:annotatedTarget [ a owl:Restriction ; owl:cardinality "1"^^xsd:nonNegativeInteger ; owl:onProperty <http://insdc.org/owl/gap_type> ] . [] a owl:Axiom ; rdfs:label <http://insdc.org/owl/MandatoryQualifiers> ; owl:annotatedProperty owl:equivalentClass ; owl:annotatedSource <http://insdc.org/owl/Assembly_Gap> ; owl:annotatedTarget [ a owl:Restriction ; owl:cardinality "1"^^xsd:nonNegativeInteger ; owl:onProperty <http://insdc.org/owl/estimated_length> ] .
例)Qualifier: gap_type
<http://insdc.org/owl/gap_type> a owl:DatatypeProperty ; rdfs:comment "type of gap connecting components in records of a genome assembly, or the type of biological gap in a record that is part of a genome assembly;" ; rdfs:domain <http://insdc.org/owl/Assembly_Gap> ; rdfs:label "gap_type" ; rdfs:range [ a rdfs:Datatype ; owl:oneOf ("between scaffolds"^^xsd:string "centromere"^^xsd:string "heterochromatin"^^xsd:string "repeat between scaffolds"^^xsd:string "repeat within scaffold"^^xsd:string "short arm"^^xsd:string "telomere"^^xsd:string "within scaffold"^^xsd:string ) ] ; rdfs:seeAlso "http://www.ncbi.nlm.nih.gov/projects/genome/assembly/agp/AGP_Specification.shtml" ; rdfs:subPropertyOf <http://insdc.org/owl/qualifier> .
- Genomic Standards Consortium (GSC15) 要旨投稿 2012.12.20〆切
課題
- トリプルストア4storeへインポートに失敗する
- qualifierの値が構造化された文字列をとる場合の記述
対応案:http://www.w3.org/TR/2004/REC-xmlschema-2-20041028/#regexs
- Class制約とData propertyの型の不整合
* 対応案: 独自の型を定義してそれぞれ参照する
今後の予定
- INSD_Seq.dtd記述関連情報の定義
- division, keyword, commentなど配列エントリー関連情報の記述する
- DDBJオントロジー開発
- INSDCオントロジーをインポートすることで独自ルールを定義
- 外部オントロジーとの対応
- 再利用性や推論を考慮し、Sequence Ontologyなど
メンバー
- 藤澤
- 片山
- 山本