BH12.12/SPARQLthon15/GenomeRefine
提供:TogoWiki
目次 |
Genome Refine
TogoAnnotatorの組込み
アノテーション更新のデータフロー方針
MiGAP → GenBank → genome.ttl のGenbankを最新のアノテーションを上書きする
TogoAnnotator入出力形式
- TogoAnnotation出力とあわせるため、MicrobeBase検索インデックスソース様のtsv形式ファイルを出力する
genome_conf/data/search_index/gi_pname.tsv
1 ds:1 dsn:1 g:slr0924 slr0924 polypeptide from Synechocystis with low homology to Tic22, Slr0924, cyanobacterial Tic22, Tic22 2 ds:1 dsn:1 g:slr1041 slr1041 PilG, Putative phototaxis protein, Crr6, Slr1041 3 ds:1 dsn:1 g:slr0073 slr0073 Hik36, Ctc36, PilN 4 ds:1 dsn:1 g:slr0322 slr0322 Hybrid histidine kinase, Chy43 5 ds:1 dsn:1 g:slr1042 slr1042 CheY-like signal transducer, PilH, Crr7, Rre7, Slr1042 6 ds:1 dsn:1 g:slr1043 slr1043 CheW-like signal transducer 7 ds:1 dsn:1 g:slr0162 slr0162 Pilin biogenesis protein 8 ds:1 dsn:1 g:slr1991 slr1991 Cya1 9 ds:1 dsn:1 g:slr1964 slr1964 FRP, Fluorescence Recovery Protein 10 ds:1 dsn:1 g:sll1371 sll1371 SYCRP1, SYCRP
genome_conf/data/search_index/gi_gname.tsv
1 ds:1 dsn:1 g:slr2016 slr2016 pilA10 2 ds:1 dsn:1 g:slr0924 slr0924 tic22 3 ds:1 dsn:1 g:slr1041 slr1041 pilG, rre6, taxP3, taxP, crr6 4 ds:1 dsn:1 g:slr0073 slr0073 pilL-N, cheA, hik36, pilL, ctc36, pilN 5 ds:1 dsn:1 g:slr0322 slr0322 pilL-C, cheA, taxAY3, hik43, pilL, taxAY, chy43, slr0322 6 ds:1 dsn:1 g:slr1042 slr1042 pilH, rre7, taxY3, taxY, crr7 7 ds:1 dsn:1 g:slr1043 slr1043 pilI, taxW3, taxW 8 ds:1 dsn:1 g:slr1044 slr1044 pilJ, ctr1, taxD3, mcpA, ctrI 9 ds:1 dsn:1 g:sll0058 sll0058 dnaK1, dnaK, dnaK4 10 ds:1 dsn:1 g:slr0162 slr0162 pilC, gspF
- rdfデータモデルの案
TogoAnnotator, TogoAnnotation, MiGAP (default) のアノテーションをまとめて考える
- skos:prefLabel, skos:altLabelを使うとよさそう
- 辞書側タームについてもリソースURIを決めると、TogoAnnotator出力アノテーションと辞書タームの関係でskos:mappingRelationが使える
検討中
MiGAP結果でproductの値のない遺伝子に対するアノテーション補完としてMBGDアノテーションの利用
- MBGD Ortholog Cluster IDに対する代表的なアノテーション情報をどのように共有するか?
→ MBGD側でannotationをortholog.ttlに記述する方向で対応してもらう