BH12.12/SPARQLthon15/GenomeRefine

提供:TogoWiki

移動: 案内, 検索

目次

Genome Refine

TogoAnnotatorの組込み

アノテーション更新のデータフロー方針

MiGAP → GenBank → genome.ttl のGenbankを最新のアノテーションを上書きする

TogoAnnotator入出力形式

  • TogoAnnotation出力とあわせるため、MicrobeBase検索インデックスソース様のtsv形式ファイルを出力する

genome_conf/data/search_index/gi_pname.tsv

1       ds:1    dsn:1   g:slr0924       slr0924 polypeptide from Synechocystis with low homology to Tic22, Slr0924, cyanobacterial Tic22, Tic22
2       ds:1    dsn:1   g:slr1041       slr1041 PilG, Putative phototaxis protein, Crr6, Slr1041
3       ds:1    dsn:1   g:slr0073       slr0073 Hik36, Ctc36, PilN
4       ds:1    dsn:1   g:slr0322       slr0322 Hybrid histidine kinase, Chy43
5       ds:1    dsn:1   g:slr1042       slr1042 CheY-like signal transducer, PilH, Crr7, Rre7, Slr1042
6       ds:1    dsn:1   g:slr1043       slr1043 CheW-like signal transducer
7       ds:1    dsn:1   g:slr0162       slr0162 Pilin biogenesis protein
8       ds:1    dsn:1   g:slr1991       slr1991 Cya1
9       ds:1    dsn:1   g:slr1964       slr1964 FRP, Fluorescence Recovery Protein
10      ds:1    dsn:1   g:sll1371       sll1371 SYCRP1, SYCRP

genome_conf/data/search_index/gi_gname.tsv

1       ds:1    dsn:1   g:slr2016       slr2016 pilA10
2       ds:1    dsn:1   g:slr0924       slr0924 tic22
3       ds:1    dsn:1   g:slr1041       slr1041 pilG, rre6, taxP3, taxP, crr6
4       ds:1    dsn:1   g:slr0073       slr0073 pilL-N, cheA, hik36, pilL, ctc36, pilN
5       ds:1    dsn:1   g:slr0322       slr0322 pilL-C, cheA, taxAY3, hik43, pilL, taxAY, chy43, slr0322
6       ds:1    dsn:1   g:slr1042       slr1042 pilH, rre7, taxY3, taxY, crr7
7       ds:1    dsn:1   g:slr1043       slr1043 pilI, taxW3, taxW
8       ds:1    dsn:1   g:slr1044       slr1044 pilJ, ctr1, taxD3, mcpA, ctrI
9       ds:1    dsn:1   g:sll0058       sll0058 dnaK1, dnaK, dnaK4
10      ds:1    dsn:1   g:slr0162       slr0162 pilC, gspF
  • rdfデータモデルの案

TogoAnnotator, TogoAnnotation, MiGAP (default) のアノテーションをまとめて考える

    • skos:prefLabel, skos:altLabelを使うとよさそう
    • 辞書側タームについてもリソースURIを決めると、TogoAnnotator出力アノテーションと辞書タームの関係でskos:mappingRelationが使える

検討中


MiGAP結果でproductの値のない遺伝子に対するアノテーション補完としてMBGDアノテーションの利用

  • MBGD Ortholog Cluster IDに対する代表的なアノテーション情報をどのように共有するか?

→ MBGD側でannotationをortholog.ttlに記述する方向で対応してもらう