BH16.12/GGGenome CyanoBase

提供:TogoWiki

2016年12月15日 (木) 09:13時点におけるMeso (トーク | 投稿記録)による版
(差分) ←前の版 | 最新版 (差分) | 次の版→ (差分)
移動: 案内, 検索

目次

GGGenomeにデータを格納するために必要な情報

上記の情報があれば、 http://GGGenome.dbcls.jp/hg38/TTCATTGACAACATT [.bed|.json|.txt] のように検索できるようになる。

CyanoBaseの情報提供

  • メタデータ: CyanoBaseの376ゲノムリストはTogoStanzaを利用して提供されており、 JSON API から取得してもらう
  • ゲノム配列: 遺伝研内のサーバ通しなのでrsyncで提供。非圧縮FASTAで1.4GB【Done】

GGGenomeでの対応

  • CyanoBaseが持っている GCA_000332055.1 などAssembly AccessionをIDとする
  • データの更新があった場合、revision (".1" の部分) が上がるのでadd & deleteで対応できそう

Todo

  • CyanoBaseがもっていない和名・慣用名的なメタデータの取得
    • DBpedia、WikiDataあたりを調査 → http://tinyurl.com/gvfj4zw
    • integbio/DBcatalog RDFの情報も使えるかも?
    • TogoStanzaを介して、SPARQLで取得CyanoBaseの表やJSONに追加できるとよさそう
  • GGGenomeヒット結果からのリンク生成
    • 現状でも、JBrowseへのリンク生成はできる イネゲノムの例
    • assembly_id, sequence_id, start, end からCyanoBaseの遺伝子リストを表示するスタンザ開発?
個人用ツール