SPARQLthon27

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
(参加者)
(参加者)
 
(間の41版分が非表示)
27行: 27行:
=== TPP グループ全体 ===
=== TPP グループ全体 ===
 +
 +
平成26年度〜の[http://biosciencedbc.jp/funding/fund 統合化推進プログラム] (TPP) の RDF 化支援
 +
 +
* [[TPP-arita|生物種メタボロームモデル・データベースの構築]] (有田)]
 +
** 質量分析の測定器のオントロジー整備(PSIより古いものの)
 +
* [[TPP-kanehisa|ゲノムとフェノタイプ・疾患・医薬品の統合データベース]] (金久)
 +
* [[TPP-kurokawa|ゲノム・メタゲノム情報統合による微生物DBの超高度化推進]] (黒川)
 +
* [[TPP-sugano|疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オミクスデータの統合]] (菅野)
 +
** ENSEMBL variation RDFの[[EBI-var|調査]]
 +
* [[TPP-tabata|植物ゲノム情報活用のための統合研究基盤の構築]] (田畑)
 +
** 病害キュレーションデータのRDF/SPARQL と NCBI GI, UniProt との Service クエリ
 +
* [[TPP-tokunaga|個別化医療に向けたヒトゲノムバリエーションデータベース]] (徳永)
 +
* [[TPP-nakamura|蛋白質構造データバンクの高度化と統合的運用]] (中村)
 +
* [[TPP-narimatsu|糖鎖統合データベースおよび国際糖鎖構造リポジトリの開発]] (成松)
 +
** PDBj と糖鎖のRDF (山田、金城)
 +
*** PDBj <-> glycoinfo.org/glytoucan.org連携のための情報交換
 +
** 名大古川先生のデータ(KOマウス) -> 理研(桝屋)へ状況説明(山田)
 +
*** [http://jcggdb.jp/doc/Project.action?projectId=1&langType=1 ノックアウトマウスを用いた機能糖鎖科学データベース] <-- 2015.1.7追加
 +
* [[TPP-masuya|生命と環境のフェノーム統合データベース]] (桝屋)
 +
** 遺伝研ゼブラフィッシュグループとの打合せ
 +
** マウス打合せ
 +
* 遺伝研で公開しているコンソミックマウスの表現型DBのRDF化へ向けての打ち合わせの実施
 +
 ・パラメーター名の確認
 +
 ・値の確認
 +
 ・ステージの確認
 +
 ・RDF化にするにあたり、必要Propertyの確認
 +
* 写真のあるデータ:マウスの剥製コレクション 地域別亜種
 +
 ・剥製のデータについては基本的に電子データになっている
 +
 ・剥製になっているものもあれば、無いものもあるが、データにはそれらについてはデータが入っている
 +
 ・マウスだけでなく、ラットやウサギもある
 +
 ・毛色については、剥製のコレクションの中にも多様性がある。
 +
 +
化合物
 +
* 天然物化合物 (時松、櫻井、山田)
 +
* 天然物の化学構造分類と生合成経路、質量、生理活性などを関連付けたい。
 +
*** そのために、今までDictionary of Natural Products (DNP)とChEBIオントロジーの対応付けなどを行ってきた。分類体系がそれぞれ異なっており構造分類と生合成経路を関連付けてきた。
 +
 +
** [http://www.chem.qmul.ac.uk/iupac/sectionF IUPAC有機化学・生化学命名法 SECTION F]にあるアルカロイドの基本骨格(Skeleton)についてDNPの項目との対応付け(時松)
 +
*** IUPAC SECTION F にある骨格は全体のサブセット。今後、後述のRDBに格納するためのデータを、総説誌・書籍(すでに収集を進めている)をもとに作成
 +
*** 基本骨格(Skeleton)と関連情報を格納するDB作成中、登録・表示のみ可、今後、編集とメタ情報を格納する項目の追加、データをSDFでダウンロード可能にすることなどが必要(山田)
 +
*** アルカロイドの6種類の骨格を入力
 +
** KNApSAcKに含まれる化合物について、基本骨格(Skeleton)を含むIDの調査 ー> 櫻井さんが良いツールを持っていた。
 +
 +
** KNApSAcK以外の化合物データベースの調査も実施したい。
 +
** 天然物の基本骨格(Skeleton)をデータベース化して色々利用できるようにしたい。
 +
*** 将来的には集めた骨格情報を化合物クラスタリング、反応予測などにも応用できれば
=== SPARQLthon グループ ===
=== SPARQLthon グループ ===
 +
 +
* 伊藤
 +
** [http://prezi.com/ewunmgczcjcv/?utm_campaign=share&utm_medium=copy&rc=ex0share Sagace + NBDC横断検索マークアップツール] → http://sagace.nibio.go.jp/devel/metadata.html β版運用中
 +
** SIDER(BIO2RDF) 化合物 <ー> 副作用 マッピングできないものについて、薬の一般名などでつなぐのはどうでしょうか?
 +
** ICD-10 RDF: BioPortal に BioHackathon中に作成した修正データを引き渡し,BioPortalでも参照の上,修正中とのこと
 +
 +
* 山中
 +
** ICGCポータルサイトのSemWeb 化
 +
 +
* 岡別府
 +
** TogoGenome 真核版(最初のバージョン終了)真核関連スタンザ作成(/w 守屋)
 +
** ファッセット検索の不具合修正
 +
 +
* 藤澤
 +
** RefSeq の更新 <-> FASTA
 +
 +
* 山口
 +
** SPARQL Builder の内部エンジンの高速化
 +
 +
* 大田
 +
** 実験プロトコルのRDF化(電子Labノート、LIMS)
 +
 +
* 永野
 +
** togostanza.org ページの作成
 +
 +
* 川島
 +
** NBRC Strain データに、BioSample をふる(/w 藤澤)
 +
** RefEx RDF化(/w 小野)
 +
 +
* 山本
 +
** [http://ontop.inf.unibz.it ontop](B2RQ のようなRDB等にSPARQLするミドルウェア、メモは[[ontop]])、[http://developer.marklogic.com/products MarkLogic](トリプルストア)をためす。ontopのSPARQL1.1対応状況は[[BH12.12/SPARQL11test]]。MarkLogicは次回。
 +
** [http://lsd.dbcls.jp Life Science Dictionary] に含まれるICD10のURIについて、伊藤さんから頂いたBioPortalにある[http://bioportal.bioontology.org/ontologies/ICD10/ Version10]にも対応。
 +
** [http://marmotta.apache.org Apache Marmotta]の3.3.0などSPARQL1.1対応状況の確認([[BH12.12/SPARQL11test]])。
 +
 +
* 片山
 +
** 指定した taxonomy ID の下位階層を含む全 RDF データをダウンロードするサービス http://togogenome.org/download で RefSeq の Turtle に加え RefSeq の FASTA と UniProt の Turtle) に対応
 +
** [[SPARQLthon27/StanzaMetadata]] togostanza.org 用スタンザメタデータの JSON 仕様策定
 +
** [[BH14.14]] ウェブサイト・登録ページ等準備
 +
 +
* 神沼
 +
** MeGAP(森さん)とDDBJ pipelineの連携関係
 +
** Genome Refine(藤澤さん)とDDBJ pipelineの連携関係
 +
** microbeDB 素材としての、SRA解析によるhost-symbiontデータ化
 +
** metagenomeのsampling protocol( http://www.earthmicrobiome.org/), geocoding protocol調査
 +
 +
=== TogoGenome 更新 ===
 +
 +
今後のスケジュール
 +
 +
* 2014/12/20-23 SPARQL エンドポイント更新
 +
* 2014/12/24-26 GitHub のブランチ作成と上記を利用した dev.togostanza.org, dev.togogenome.org のセットアップ
 +
* 2014/12/27-1/4 SPARQL本執筆
 +
* 2015/1/5-9  新エンドポイント対応へ SPARQL を改定、動作確認
 +
* 2015/1/10-12 SPARQL本執筆
 +
* 2015/1/13-15 新エンドポイント対応へ SPARQL を改定、動作確認
 +
** テキスト検索用 SPARQL 開発
 +
* 2015/2/2-6 国内版バイオハッカソン BH14.14
 +
** 真核・ヒト対応スタンザの増強
 +
 +
真核対応と insdc2ttl.rb 更新による SPARQL の変更が必要なものを次回 SPARQLthon28 までに更新するための担当スタンザ
 +
 +
* MicrobeDB.jp: 60 スタンザ中依存部分は最大でも 30 程度?
 +
* TogoGenome.org: 約 30 個くらい?
 +
* CyanoBase: 約 6 個くらい?
 +
* MBGD: 該当なし?
 +
 +
→ ざっくりと 80 個くらいの動作確認・書き換えが必要 → 6 人で分担して 1/5-9 の 5 日間で 1 人あたり 10 個、1 日 2 個程度こなす
 +
 +
3末までの TODO
 +
 +
* オントロジーの更新とそれに対応した RDF データ、SPARQL の更新
 +
* テキスト検索 SPARQL 開発
 +
* TogoStanza.org セットアップ、コンテンツ執筆
 +
* JavaScript 版 TogoStanza リリース
 +
* MicrobeDB.jp の検索システム刷新
 +
 +
その後の TODO
 +
 +
* JavaScript 版に TogoStanza を書き換え
 +
* Assembly report から RefSeq に加え GenBank からもデータ取得する
 +
* スタンザオントロジーの構築
 +
* TogoStanza.org の活用と国際的な開発コミュニティの醸成
 +
* 2015/1 月リリース予定の Ensembl RDF との連携
 +
* 東北大 ToMMo との連携
 +
* UCSC/GA4GH との連携
 +
 +
=== DDBJ 見学 ===
 +
 +
* 富士山 〜 スパコン 〜 シーケンサー室 〜 大量研 〜 高木研
== 参考リンク ==
== 参考リンク ==
59行: 194行:
* 市原寿子(かずさ)
* 市原寿子(かずさ)
* 呉 紅艶(DBCLS)
* 呉 紅艶(DBCLS)
 +
* 神沼英里 (遺伝研)19日のみ

2015年4月2日 (木) 02:09時点における最新版

第27回 SPARQLthon を下記日程で開催したいと思います。

目次

開催概要

  • 開催期間:12月18日(木) 10:00 〜 19日(金) 18:00
  • 開催場所:遺伝学研究所 生命情報研究センター棟 (DDBJ棟) 4F会議室 (W403-405) + 生命情報研究棟西棟 DBCLS
  • アクセス:http://dbcls.rois.ac.jp/access
    • 遺伝研行きのシャトルバスがあります。乗り口は北口から出てロータリー向かって左手です。
    • 新幹線ーNIGシャトルバス接続情報
    • 9:30出発のシャトルバスに乗ってお越しいただくと、DDBJ棟までご案内します。
      • 関東方面からお越しの方は こだま639号 (東京8:26発、品川8:34発) がスムーズです。
      • 関西方面からお越しの方は こだま632号 (名古屋7:29発) がスムーズですが、朝が早いので前泊する方が楽です。
  • お昼について
    • 所内には小さい食堂がありますが、売店などはありません。お弁当などをお持ち頂くことをお勧めします。
  • 夕食について
    • 初日の夕食は参加者のみなさまで三島駅前に出かける予定です。
  • ホテルについて
  • 開催連絡:http://groups.google.com/group/biohackathon-jp メーリングリストにて

プロジェクト

TPP グループ全体

平成26年度〜の統合化推進プログラム (TPP) の RDF 化支援

 ・パラメーター名の確認  ・値の確認  ・ステージの確認  ・RDF化にするにあたり、必要Propertyの確認

  • 写真のあるデータ:マウスの剥製コレクション 地域別亜種

 ・剥製のデータについては基本的に電子データになっている  ・剥製になっているものもあれば、無いものもあるが、データにはそれらについてはデータが入っている  ・マウスだけでなく、ラットやウサギもある  ・毛色については、剥製のコレクションの中にも多様性がある。

化合物

  • 天然物化合物 (時松、櫻井、山田)
  • 天然物の化学構造分類と生合成経路、質量、生理活性などを関連付けたい。
      • そのために、今までDictionary of Natural Products (DNP)とChEBIオントロジーの対応付けなどを行ってきた。分類体系がそれぞれ異なっており構造分類と生合成経路を関連付けてきた。
    • IUPAC有機化学・生化学命名法 SECTION Fにあるアルカロイドの基本骨格(Skeleton)についてDNPの項目との対応付け(時松)
      • IUPAC SECTION F にある骨格は全体のサブセット。今後、後述のRDBに格納するためのデータを、総説誌・書籍(すでに収集を進めている)をもとに作成
      • 基本骨格(Skeleton)と関連情報を格納するDB作成中、登録・表示のみ可、今後、編集とメタ情報を格納する項目の追加、データをSDFでダウンロード可能にすることなどが必要(山田)
      • アルカロイドの6種類の骨格を入力
    • KNApSAcKに含まれる化合物について、基本骨格(Skeleton)を含むIDの調査 ー> 櫻井さんが良いツールを持っていた。
    • KNApSAcK以外の化合物データベースの調査も実施したい。
    • 天然物の基本骨格(Skeleton)をデータベース化して色々利用できるようにしたい。
      • 将来的には集めた骨格情報を化合物クラスタリング、反応予測などにも応用できれば

SPARQLthon グループ

  • 山中
    • ICGCポータルサイトのSemWeb 化
  • 岡別府
    • TogoGenome 真核版(最初のバージョン終了)真核関連スタンザ作成(/w 守屋)
    • ファッセット検索の不具合修正
  • 藤澤
    • RefSeq の更新 <-> FASTA
  • 山口
    • SPARQL Builder の内部エンジンの高速化
  • 大田
    • 実験プロトコルのRDF化(電子Labノート、LIMS)
  • 永野
    • togostanza.org ページの作成
  • 川島
    • NBRC Strain データに、BioSample をふる(/w 藤澤)
    • RefEx RDF化(/w 小野)
  • 片山
    • 指定した taxonomy ID の下位階層を含む全 RDF データをダウンロードするサービス http://togogenome.org/download で RefSeq の Turtle に加え RefSeq の FASTA と UniProt の Turtle) に対応
    • SPARQLthon27/StanzaMetadata togostanza.org 用スタンザメタデータの JSON 仕様策定
    • BH14.14 ウェブサイト・登録ページ等準備
  • 神沼
    • MeGAP(森さん)とDDBJ pipelineの連携関係
    • Genome Refine(藤澤さん)とDDBJ pipelineの連携関係
    • microbeDB 素材としての、SRA解析によるhost-symbiontデータ化
    • metagenomeのsampling protocol( http://www.earthmicrobiome.org/), geocoding protocol調査

TogoGenome 更新

今後のスケジュール

  • 2014/12/20-23 SPARQL エンドポイント更新
  • 2014/12/24-26 GitHub のブランチ作成と上記を利用した dev.togostanza.org, dev.togogenome.org のセットアップ
  • 2014/12/27-1/4 SPARQL本執筆
  • 2015/1/5-9 新エンドポイント対応へ SPARQL を改定、動作確認
  • 2015/1/10-12 SPARQL本執筆
  • 2015/1/13-15 新エンドポイント対応へ SPARQL を改定、動作確認
    • テキスト検索用 SPARQL 開発
  • 2015/2/2-6 国内版バイオハッカソン BH14.14
    • 真核・ヒト対応スタンザの増強

真核対応と insdc2ttl.rb 更新による SPARQL の変更が必要なものを次回 SPARQLthon28 までに更新するための担当スタンザ

  • MicrobeDB.jp: 60 スタンザ中依存部分は最大でも 30 程度?
  • TogoGenome.org: 約 30 個くらい?
  • CyanoBase: 約 6 個くらい?
  • MBGD: 該当なし?

→ ざっくりと 80 個くらいの動作確認・書き換えが必要 → 6 人で分担して 1/5-9 の 5 日間で 1 人あたり 10 個、1 日 2 個程度こなす

3末までの TODO

  • オントロジーの更新とそれに対応した RDF データ、SPARQL の更新
  • テキスト検索 SPARQL 開発
  • TogoStanza.org セットアップ、コンテンツ執筆
  • JavaScript 版 TogoStanza リリース
  • MicrobeDB.jp の検索システム刷新

その後の TODO

  • JavaScript 版に TogoStanza を書き換え
  • Assembly report から RefSeq に加え GenBank からもデータ取得する
  • スタンザオントロジーの構築
  • TogoStanza.org の活用と国際的な開発コミュニティの醸成
  • 2015/1 月リリース予定の Ensembl RDF との連携
  • 東北大 ToMMo との連携
  • UCSC/GA4GH との連携

DDBJ 見学

  • 富士山 〜 スパコン 〜 シーケンサー室 〜 大量研 〜 高木研

参考リンク


参加者

  • 片山俊明 (DBCLS)
  • 川島秀一 (DBCLS)
  • 岡別府陽子(MSS)
  • 守屋勇樹 (DBCLS)
  • 藤澤貴智(遺伝研)
  • 山本泰智 (DBCLS)
  • 桝屋啓志 (理研BRC)
  • 高月照江 (理研BRC)
  • 矢田有加里 (理研BRC)
  • 伊藤真和吏 (NIBIO) 18日のみ
  • 永野朗夫 (PENQE)
  • 大田達郎 (DBCLS)
  • 時松敏明 (DBCLS)
  • 山口敦子 (DBCLS)
  • 千葉啓和(基生研)
  • 櫻井望(かずさ)18日のみ
  • 山田一作(野口研)
  • 金城玲(阪大)
  • 森宙史(東工大)19日のみ
  • 山中遼太(先端研)
  • 平川英樹(かずさ)18日のみ
  • 市原寿子(かずさ)
  • 呉 紅艶(DBCLS)
  • 神沼英里 (遺伝研)19日のみ
個人用ツール