BH12.12/SPARQLthon10/TogoStanza

提供:TogoWiki

移動: 案内, 検索

目次

TogoStanza サーバのパッケージ化

  • TogoGenome から UI をのぞいた Stanza サーバ部分を togostanza-server としてパッケージ化する
  • 現状↑のレポジトリに内蔵されている各スタンザも独立したレポジトリ/パッケージとして、好きな組み合わせでサーバに差し込めるようにする
  • Rails の機能はほとんど使っていないので、Rack アプリに変更する (or Rails engine 化?)

TogoStanza サーバの機能

  • スタンザを HTTPD として提供する
  • スタンザの一覧とヘルプを表示
  • デフォルトの CSS を提供
  • スタンザが利用する SPARQL endpoint のリストを管理

TogoStanza レポジトリ

  • スタンザサーバが提供するスタンザのリストを自動的にレポジトリに登録?

TogoStanza のスタンザ

  • 各スタンザは togostanza-* として別途個別にレポジトリを作る (世界中の開発者に fork してもらいたい)
  • togostanza-table や togostanza-graph などのメタパッケージも提供?

TogoStanza オントロジー

  • 各スタンザは、引数として必要とする入力パラメータ(コンテクスト)でカテゴリ化できる
    • MEO ID → 環境レポート用のスタンザ
    • Taxonomy ID/BioProject ID → 生物種レポート用のスタンザ
    • Gene ID / Locus tag → 遺伝子レポート用のスタンザ

TogoStanza の拡張

  • BioInterchange
    • ローカルの GFF3 などを RDF にして、TogoGenome と融合
  • InterMine
    • 真核生物種のアノテーションをリッチに
  • BaseSpace
    • BAM/VCF などを取得し TogoGenome を用いてアノテーションする

追加するスタンザの優先順位

  • 現状の確認 → 10/5 までのプライオリティ
    • 松:EdgeStore とメタゲ以外はほぼ完了
    • 竹・梅:下記クライテリアで選ぶ
  • 10/5 までにカタチをつけておきたいスタンザ
  1. オルソログ(遺伝子レポート)→ MBGDグループより提供予定
  2. 菌株情報スタンザの内容確認と更新 → "Relation type" TaxID名寄せ部分のランク表示について検討
  3. ゲノムブラウザ→JBrowseを利用可能か検討する
  4. 大規模データチームが整理しているデータの活用
  • サイエンティフィックに欲しいスタンザ
  1. 代謝パスウエイ
  2. 化合物(代謝パスウエイ、タンパク質結合リガンド)
  3. 発現データ、*-Seq?
  4. タンパク質相互作用?

遺伝子レポート

  • 松的にはほぼ完成、↑を中心に追加予定

生物レポート

  • 既存のものを出し切って、順番、取捨選択、追加するべきものを検討
    • UniProt の各生物種ごとの統計処理によって、プロテオームの内訳がわかるビューを提供
    • アノテーションのついている遺伝子数、ついてない遺伝子数といった内訳
    • GO や Pfam のツリーマップ
    • オーソログ遺伝子群のフィロジェネティックプロファイル
    • rRNA 遺伝子数のうちわけ、tRNA 遺伝子とコドン表 (codon usage)
    • 各生物種ごとに、遺伝子のリストを表示。各遺伝子にはデフィニションの横に関連論文が出た年表をつけてみる?
    • ストレイン (bioproject) のリスト
    • ゲノムブラウザ

環境レポート

  • Microbedb.jp のものをとりあえず使う
  1. Definition
  2. Google map
  3. GOLD List
  4. Taxonomy composition → sunburst 化
  5. Strain list (BRC)
  6. MEO ontology view

修正点

  • スタンザ名の再検討と、スタンザの URI との整合性の反映
    • Pathgen → Pathogen
    • Plot → ?
  • "No item found" 表示の改善
    • タイトルとのスペースをつめる
    • "No data" という表記にする
  • Pfam plotのマルチドメイン対応
    • Pfam名をプルダウンメニューで選択する