BH12.12/TogoGenome

提供:TogoWiki

移動: 案内, 検索

ゲノム情報の RDF 化

  • INSDC のオントロジー 作成
    • SO
    • FALDO
    • INSDC.owl
      • Feature/Qualifier - FT <-> SO
      • DB XREF - Identifiers.org
  • RefSeq (のprokaryote) エントリの RDF を生成
    • DDBJ の http://fat:8892/sparql に <http://v5.genome.db/> としてストアされているものが最新
      • 元データは ~ktym/project/rdfgenome/wget_prokaryote.v5/**/*.ttl
      • 42GB
      • 455,322,591 triples
      • 19,981,922 URIs
      • 75,363,941 UUIDs
      • 96 predicates
152898623 rdf:type
44102584 rdfs:label
40926808 faldo:reference
40926808 faldo:position
30128855 rdfs:seeAlso
20463404 faldo:end
20463404 faldo:begin
20459536 obo:so_part_of
13973729 insdc:location_string
13973729 faldo:location
13868333 insdc:feature_locus_tag
6701192 insdc:feature_product
6486350 obo:so_has_part
6486350 insdc:feature_transl_table
6486350 insdc:feature_codon_start
6485705 insdc:feature_translation
4419283 insdc:feature_note
2793204 insdc:feature_gene
1706510 insdc:feature_inference
762918 insdc:feature_EC_number
309060 insdc:feature_function
164543 insdc:feature_old_locus_tag
126161 insdc:feature_pseudo
72012 insdc:feature_gene_synonym
20815 insdc:feature_experiment
14092 insdc:feature_codon_recognized
12731 insdc:feature_operon
11131 insdc:feature_rpt_family
10385 insdc:feature_mobile_element_type
6145 insdc:feature_anticodon
4558 insdc:feature_rpt_type
  :
  • ヒストリ
    • v1: BioRuby を使った RefSeq -> Turtle コンバータ
    • v2: URI を見直し
    • v3: URI を URN (UUID) 化
    • v4: Identifiers.org を使用、バグフィックス
    • v5: FALDOの更新 fix、INSDC オントロジーへの暫定移行
    • v6: INSDC.owl の正式採用(予定)
個人用ツール