BH12.12/INSDCオントロジー

提供:TogoWiki

移動: 案内, 検索

目次

目的

INSDC配列エントリー(Genbank, EMBL, DDBJ 形式)のRDF化のためのオントロジー開発

事前準備

  • INSDCエントリー周辺情報の調査(2012年8月〜)
  • プロトタイプ作成 (2012年12月12日〜)

BH12.12での作業

  • Feature Table Definition version 10.2をOWLで定義する。
    • featureをclassとして定義する 【Done】
    • qualiferをdatatype propertyとして定義する【Done】
    • Controlled vocabularyをdata propertyのrangeもしくはIndividualsとして定義する【Done】
    • feature-qualifer間の関係情報をdata propertyのdomainで定義する【Done】
    • mandatory, optional qualifierをclassの制約クラスで定義する【Todo】
    • feature の Molecular scope, Organisim scopeを定義する【Todo】

例) Feature: Assembly_Gap

<http://insdc.org/owl/Assembly_Gap>
    a owl:Class ;
    rdfs:comment "gap between two components of a CON record that is part of a genome assembly;" ;
    rdfs:label "assembly_gap" ;
    rdfs:subClassOf <http://insdc.org/owl/Feature> ;
    owl:equivalentClass [
        a owl:Restriction ;
        owl:cardinality "1"^^xsd:nonNegativeInteger ;
        owl:onProperty <http://insdc.org/owl/estimated_length>
    ], [
        a owl:Restriction ;
        owl:cardinality "1"^^xsd:nonNegativeInteger ;
        owl:onProperty <http://insdc.org/owl/gap_type>
    ] .

[]
    a owl:Axiom ;
    rdfs:label <http://insdc.org/owl/MandatoryQualifiers> ;
    owl:annotatedProperty owl:equivalentClass ;
    owl:annotatedSource <http://insdc.org/owl/Assembly_Gap> ;
    owl:annotatedTarget [
        a owl:Restriction ;
        owl:cardinality "1"^^xsd:nonNegativeInteger ;
        owl:onProperty <http://insdc.org/owl/gap_type>
    ] .  

[]
    a owl:Axiom ;
    rdfs:label <http://insdc.org/owl/MandatoryQualifiers> ;
    owl:annotatedProperty owl:equivalentClass ;
    owl:annotatedSource <http://insdc.org/owl/Assembly_Gap> ;
    owl:annotatedTarget [
        a owl:Restriction ;
        owl:cardinality "1"^^xsd:nonNegativeInteger ;
        owl:onProperty <http://insdc.org/owl/estimated_length>
    ] .  


例)Qualifier: gap_type

<http://insdc.org/owl/gap_type>
    a owl:DatatypeProperty ;
    rdfs:comment "type of gap connecting components in records of a genome assembly, or the type of biological gap in a record that is part of a genome assembly;" ;
    rdfs:domain <http://insdc.org/owl/Assembly_Gap> ;
    rdfs:label "gap_type" ;
    rdfs:range [
        a rdfs:Datatype ;
        owl:oneOf ("between scaffolds"^^xsd:string
            "centromere"^^xsd:string
            "heterochromatin"^^xsd:string
            "repeat between scaffolds"^^xsd:string
            "repeat within scaffold"^^xsd:string
            "short arm"^^xsd:string
            "telomere"^^xsd:string
            "within scaffold"^^xsd:string
        )
    ] ;
    rdfs:seeAlso "http://www.ncbi.nlm.nih.gov/projects/genome/assembly/agp/AGP_Specification.shtml" ;
    rdfs:subPropertyOf <http://insdc.org/owl/qualifier> .
  • Genomic Standards Consortium (GSC15) 要旨投稿 2012.12.20〆切

課題

  • トリプルストア4storeへインポートに失敗する
  • qualifierの値が構造化された文字列をとる場合の記述
対応案:http://www.w3.org/TR/2004/REC-xmlschema-2-20041028/#regexs
  • Class制約とData propertyの型の不整合
* 対応案: 独自の型を定義してそれぞれ参照する

今後の予定

  • INSD_Seq.dtd記述関連情報の定義
    • division, keyword, commentなど配列エントリー関連情報の記述する
  • DDBJオントロジー開発
    • INSDCオントロジーをインポートすることで独自ルールを定義
  • 外部オントロジーとの対応
    • 再利用性や推論を考慮し、Sequence Ontologyなど

メンバー

  • 藤澤
  • 片山
  • 山本