BH16.12/GGGenome CyanoBase
提供:TogoWiki
目次 |
GGGenomeにデータを格納するために必要な情報
- GGGenomeヘルプページの検索可能なデータベース一覧に表示されているメタデータ
- Database: hg38
- Source: UCSC
- Group: Mammal
- Species: Human
- 生物種: ヒト
- Latin name: Homo sapiens
- Assembly information: GRCh38/hg38 (Dec, 2013)
- 配列入手先のリンク: http://genome.ucsc.edu/cgi-bin/hgGateway?db=hg38
- ゲノム配列(FASTA形式)
上記の情報があれば、 http://GGGenome.dbcls.jp/hg38/TTCATTGACAACATT [.bed|.json|.txt] のように検索できるようになる。
CyanoBaseの情報提供
- メタデータ: CyanoBaseの376ゲノムリストはTogoStanzaを利用して提供されており、 JSON API から取得してもらう
- ゲノム配列: 遺伝研内のサーバ通しなのでrsyncで提供。非圧縮FASTAで1.4GB【Done】
GGGenomeでの対応
- CyanoBaseが持っている GCA_000332055.1 などAssembly AccessionをIDとする
- データの更新があった場合、revision (".1" の部分) が上がるのでadd & deleteで対応できそう
Todo
- CyanoBaseがもっていない和名・慣用名的なメタデータの取得
- DBpedia、WikiDataあたりを調査 → http://tinyurl.com/gvfj4zw
- integbio/DBcatalog RDFの情報も使えるかも?
- TogoStanzaを介して、SPARQLで取得CyanoBaseの表やJSONに追加できるとよさそう
- GGGenomeヒット結果からのリンク生成
- 現状でも、JBrowseへのリンク生成はできる イネゲノムの例
- assembly_id, sequence_id, start, end からCyanoBaseの遺伝子リストを表示するスタンザ開発?