SPARQLthon24

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
(TPP グループ全体)
((場所間違い訂正))
 
(間の38版分が非表示)
14行: 14行:
* [[TPP-arita|生物種メタボロームモデル・データベースの構築]] (有田)
* [[TPP-arita|生物種メタボロームモデル・データベースの構築]] (有田)
** D2RQ を使った SPARQL 検索(櫻井)
** D2RQ を使った SPARQL 検索(櫻井)
 +
** → サーバを立ち上げて SPARQL が叩けるようになった。今後マッピングの検討を行う。
* [[TPP-kurokawa|ゲノム・メタゲノム情報統合による微生物DBの超高度化推進]] (黒川)
* [[TPP-kurokawa|ゲノム・メタゲノム情報統合による微生物DBの超高度化推進]] (黒川)
** オーソログと感染症の関係のスタンザの続き (森、千葉、山本)
** オーソログと感染症の関係のスタンザの続き (森、千葉、山本)
19行: 20行:
*** ユーザのゲノム・メタゲノムデータを GenomeRefine から MicrobeDB.jp に入れる
*** ユーザのゲノム・メタゲノムデータを GenomeRefine から MicrobeDB.jp に入れる
*** FASTA, FASTQ から MeGap, MiGAP で TSV を生成し GenomeRefine が RDF を出力して MicrobeDB.jp へ
*** FASTA, FASTQ から MeGap, MiGAP で TSV を生成し GenomeRefine が RDF を出力して MicrobeDB.jp へ
 +
*** → データをどのように交換するかのフローについて決定した
* [[TPP-sugano|疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オミクスデータの統合]] (菅野)
* [[TPP-sugano|疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オミクスデータの統合]] (菅野)
** 変異などのサンプルデータをもらったので MySQL に入れて、[[http://172.17.1.196:2020/ D2RQ]] (内部のみ) で SPARQL 検索できるように(河野)
** 変異などのサンプルデータをもらったので MySQL に入れて、[[http://172.17.1.196:2020/ D2RQ]] (内部のみ) で SPARQL 検索できるように(河野)
*** まずはデータの中身を調べることから(テーブル数は 80 くらい、染色体ごとに分かれているなど、スキーマが何パターンあるか)
*** まずはデータの中身を調べることから(テーブル数は 80 くらい、染色体ごとに分かれているなど、スキーマが何パターンあるか)
*** 既存オントロジーのマッピングを先に行うか、作成する TogoStanza/アプリケーション を考えながらオントロジーを設計するか
*** 既存オントロジーのマッピングを先に行うか、作成する TogoStanza/アプリケーション を考えながらオントロジーを設計するか
 +
*** → D2RQ で SPARQL エンドポイントを構築した
* [[TPP-tabata|植物ゲノム情報活用のための統合研究基盤の構築]] (田畑)
* [[TPP-tabata|植物ゲノム情報活用のための統合研究基盤の構築]] (田畑)
-
** TBD
+
** 植物学会の辞書(日・英)などから TPP で作成するオントロジーと Plant オントロジー(英・日・西)との関連づけを進める(市原)
 +
*** 辞書ごとの語彙の違いのマッピングは手作業でやらざるを得ない(コンフリクトの解消は政治的)
 +
*** 何のため(ファセット検索など)のためにオントロジーを作るといった目的を決めるか、語彙全体のカバレッジを上げることを目指すのか
* [[TPP-narimatsu|糖鎖統合データベースおよび国際糖鎖構造リポジトリの開発]] (成松)
* [[TPP-narimatsu|糖鎖統合データベースおよび国際糖鎖構造リポジトリの開発]] (成松)
** GlycoProt DB のオントロジーを開発する(新町, 鈴木)
** GlycoProt DB のオントロジーを開発する(新町, 鈴木)
 +
*** → 8割方完成、オントロジーの可視化ツールが欲しい
** ペプチドの特定の部位に Glycan がのっているデータについてのオントロジー開発(鹿内)
** ペプチドの特定の部位に Glycan がのっているデータについてのオントロジー開発(鹿内)
 +
*** → 作成中
** レクチンのデータベース LfDB のオントロジー開発(木下)
** レクチンのデータベース LfDB のオントロジー開発(木下)
 +
*** → RDF 化を進めているが、一部データプロバイダと相談する必要あり
* [[TPP-masuya|生命と環境のフェノーム統合データベース]] (桝屋)
* [[TPP-masuya|生命と環境のフェノーム統合データベース]] (桝屋)
** フェノタイプの RDF 化について、他グループとのすりあわせ
** フェノタイプの RDF 化について、他グループとのすりあわせ
-
** Biological entityについて:
+
** <div id="biological entity"></div>Biological entityについて:[[TPP-DB#biological entity | 各回のまとめ]]
 +
***[[ファイル:Bio-entity.jpg]]
 +
*** 図における"taxon"プロパティについて
 +
**** RO:in taxon を使用:DDBJ(予定)、桝屋G、黒川G(予定)
 +
*** Strain部分について
 +
**** TogoOrganismとかぶる部分がありそう。共通化や連携があると良い???
 +
**<div id="数値/定量値"></div>数値/定量値について
 +
*** 黒川Gと同じブランクノードを使った記述とする
 +
****[[ファイル:2.jpg]]
 +
<pre>
 +
[
 +
a:濃度量;
 +
:value “100”^^xsd:demical;
 +
:unit <mg/ml>
 +
]  
 +
</pre>
=== SPARQLthon グループ ===
=== SPARQLthon グループ ===
-
* DDBJ オントロジーの開発
+
* [[SPARQLthon24/DDBJ|DDBJ オントロジーの開発]]
** http://ddbj.nig.ac.jp/ontologies/ で公開予定 (ddbj → tga)
** http://ddbj.nig.ac.jp/ontologies/ で公開予定 (ddbj → tga)
 +
** Taxonomyは毎日、INSDC/DDBJは年1回の更新
* TogoGenome の RDF 更新
* TogoGenome の RDF 更新
** 表現系のデータ更新(川島)
** 表現系のデータ更新(川島)
** DDBJ/INSDC オントロジーの最終版にあわせてエントリのメタデータ部分の RDF 化を完成(片山・藤沢)
** DDBJ/INSDC オントロジーの最終版にあわせてエントリのメタデータ部分の RDF 化を完成(片山・藤沢)
** 真核ゲノム RDF 化と TogoStanza 開発(守屋・川島・片山)
** 真核ゲノム RDF 化と TogoStanza 開発(守屋・川島・片山)
-
* 化合物(小寺・山田)
+
* 化合物(小寺・山田・時松・櫻井)
** KNApSAcK や日化辞などの DB に含まれている天然化合物を RDF で表現し分類、マスタグの意味付けなどに利用
** KNApSAcK や日化辞などの DB に含まれている天然化合物を RDF で表現し分類、マスタグの意味付けなどに利用
-
** ChEBI のオントロジーが天然物用にはしっくりこないので、オントロジーの整備から(小寺・時松)
+
*** 多数の化合物が得られた時に、その化合物を一個一個チェックして共通点を発見するのは辛い。それを自動化する仕組みが欲しい。
 +
** ChEBI のオントロジーが天然物用にはしっくりこないので、オントロジーの整備から
 +
*** 詳しくは http://wiki.lifesciencedb.jp/mw/%E5%A4%A9%E7%84%B6%E7%89%A9
 +
** KEGGやKNApSAcKの化合物を網羅的に眺めて楽しむページ
 +
*** http://web.kuicr.kyoto-u.ac.jp/cgi-bin/kot/view/index.cgi
 +
** JSTの日本化学物質辞書(日化辞)のRDFデータがCC BYで公開される見込み(櫛田)
 +
*** TPPの成果DBやアーカイブの収録されているDBの化合物情報を日化辞をハブとして統合することを目指す。
 +
*** CHEMINFおよびSIOを使って標準化を進める。
 +
*** 参考資料(https://wg.biosciencedbc.jp/lib/exe/fetch.php/nbdc_nikkaji_rdf_20140926.pdf)
* [[がんゲノム]]の RDF 調査、Linked ICGC (山中)
* [[がんゲノム]]の RDF 調査、Linked ICGC (山中)
** ICGC のテーブルからオントロジーへの対応
** ICGC のテーブルからオントロジーへの対応
-
* SPARQL Builder の改良(小林・レンツ)
+
* SPARQL Builder の改良(小林・レンツ・古崎・呉・山口)
 +
** 改良版 [http://www.sparqlbuilder.org/sb.html] パスのランキング機能,ラベル表示機能,パス数表示機能等追加
** Linked Data 用のオントロジー (VoID) + SPARQL 1.1 用のオントロジー ([http://www.w3.org/TR/sparql11-service-description Service Description]) による SPARQL endpoint のメタデータ記述について標準化をすすめたい
** Linked Data 用のオントロジー (VoID) + SPARQL 1.1 用のオントロジー ([http://www.w3.org/TR/sparql11-service-description Service Description]) による SPARQL endpoint のメタデータ記述について標準化をすすめたい
*** EBI の [http://www.ebi.ac.uk/fgpt/sw/lodestar/ Lodestar] 用メタデータ記述
*** EBI の [http://www.ebi.ac.uk/fgpt/sw/lodestar/ Lodestar] 用メタデータ記述
53行: 86行:
**** d3sparql で sparqlbin 的なサービスも ([https://github.com/mhausenblas/sparqlbin.com sparqlbin], [https://github.com/jhs/build-couchdb sparqlbinで使うApache CouchDBインスト手順])
**** d3sparql で sparqlbin 的なサービスも ([https://github.com/mhausenblas/sparqlbin.com sparqlbin], [https://github.com/jhs/build-couchdb sparqlbinで使うApache CouchDBインスト手順])
**** Rene さんのオントロジー→ Word ドキュメントを生成するツール([https://github.com/ReneRanzinger/GlycoRDF/wiki/OntologyDocumentation])
**** Rene さんのオントロジー→ Word ドキュメントを生成するツール([https://github.com/ReneRanzinger/GlycoRDF/wiki/OntologyDocumentation])
-
*** [[TripleDataProfiler]]を用いたSPARQLエンドポイントのメタデータを収集したサイトの公開 [http://tm.dbcls.jp/tdp]]
+
**** RDF online translator ([http://rdf-translator.appspot.com/])
* SPARQLTester - エンドポイントテスト用のスクリプトを公開(山本)
* SPARQLTester - エンドポイントテスト用のスクリプトを公開(山本)
 +
** → SPARQLbin と Lodestar をローカルでテストすることに成功 ([[SPARQLthon/SPARQL_b_i_n]], [[SPARQLthon/LODEStar]])
 +
** [[TripleDataProfiler]]を用いたSPARQLエンドポイントのメタデータを収集したサイトの公開 [http://tm.dbcls.jp/tdp]
 +
 +
=== BioHackathon ===
 +
 +
* Tシャツ http://tinyurl.com/ljcxw5y
== 参考リンク ==
== 参考リンク ==
89行: 128行:
* 西出浩世(基生研)
* 西出浩世(基生研)
* 鈴木真也(東工大)25日のみ
* 鈴木真也(東工大)25日のみ
 +
* 古崎晃司(大阪大)26日のみ
 +
* 櫛田達矢(NBDC)26日のみ
 +
* 畠中秀樹(NBDC)26日のみ
 +
 +
 +
[[Category:SPARQLthon]]

2014年11月17日 (月) 02:02時点における最新版

第24回 SPARQLthon を下記日程で開催したいと思います。

目次

開催概要

プロジェクト

TPP グループ全体

  • 生物種メタボロームモデル・データベースの構築 (有田)
    • D2RQ を使った SPARQL 検索(櫻井)
    • → サーバを立ち上げて SPARQL が叩けるようになった。今後マッピングの検討を行う。
  • ゲノム・メタゲノム情報統合による微生物DBの超高度化推進 (黒川)
    • オーソログと感染症の関係のスタンザの続き (森、千葉、山本)
    • GenomeRefine + MicrobeDB.jp の連携(森)
      • ユーザのゲノム・メタゲノムデータを GenomeRefine から MicrobeDB.jp に入れる
      • FASTA, FASTQ から MeGap, MiGAP で TSV を生成し GenomeRefine が RDF を出力して MicrobeDB.jp へ
      • → データをどのように交換するかのフローについて決定した
  • 疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オミクスデータの統合 (菅野)
    • 変異などのサンプルデータをもらったので MySQL に入れて、[D2RQ] (内部のみ) で SPARQL 検索できるように(河野)
      • まずはデータの中身を調べることから(テーブル数は 80 くらい、染色体ごとに分かれているなど、スキーマが何パターンあるか)
      • 既存オントロジーのマッピングを先に行うか、作成する TogoStanza/アプリケーション を考えながらオントロジーを設計するか
      • → D2RQ で SPARQL エンドポイントを構築した
  • 植物ゲノム情報活用のための統合研究基盤の構築 (田畑)
    • 植物学会の辞書(日・英)などから TPP で作成するオントロジーと Plant オントロジー(英・日・西)との関連づけを進める(市原)
      • 辞書ごとの語彙の違いのマッピングは手作業でやらざるを得ない(コンフリクトの解消は政治的)
      • 何のため(ファセット検索など)のためにオントロジーを作るといった目的を決めるか、語彙全体のカバレッジを上げることを目指すのか
  • 糖鎖統合データベースおよび国際糖鎖構造リポジトリの開発 (成松)
    • GlycoProt DB のオントロジーを開発する(新町, 鈴木)
      • → 8割方完成、オントロジーの可視化ツールが欲しい
    • ペプチドの特定の部位に Glycan がのっているデータについてのオントロジー開発(鹿内)
      • → 作成中
    • レクチンのデータベース LfDB のオントロジー開発(木下)
      • → RDF 化を進めているが、一部データプロバイダと相談する必要あり
  • 生命と環境のフェノーム統合データベース (桝屋)
    • フェノタイプの RDF 化について、他グループとのすりあわせ
    • Biological entityについて: 各回のまとめ
      • Bio-entity.jpg
      • 図における"taxon"プロパティについて
        • RO:in taxon を使用:DDBJ(予定)、桝屋G、黒川G(予定)
      • Strain部分について
        • TogoOrganismとかぶる部分がありそう。共通化や連携があると良い???
    • 数値/定量値について
      • 黒川Gと同じブランクノードを使った記述とする
        • 2.jpg
[
a:濃度量; 
:value “100”^^xsd:demical; 
:unit <mg/ml>
]  

SPARQLthon グループ

  • DDBJ オントロジーの開発
  • TogoGenome の RDF 更新
    • 表現系のデータ更新(川島)
    • DDBJ/INSDC オントロジーの最終版にあわせてエントリのメタデータ部分の RDF 化を完成(片山・藤沢)
    • 真核ゲノム RDF 化と TogoStanza 開発(守屋・川島・片山)
  • 化合物(小寺・山田・時松・櫻井)
    • KNApSAcK や日化辞などの DB に含まれている天然化合物を RDF で表現し分類、マスタグの意味付けなどに利用
      • 多数の化合物が得られた時に、その化合物を一個一個チェックして共通点を発見するのは辛い。それを自動化する仕組みが欲しい。
    • ChEBI のオントロジーが天然物用にはしっくりこないので、オントロジーの整備から
    • KEGGやKNApSAcKの化合物を網羅的に眺めて楽しむページ
    • JSTの日本化学物質辞書(日化辞)のRDFデータがCC BYで公開される見込み(櫛田)
  • がんゲノムの RDF 調査、Linked ICGC (山中)
    • ICGC のテーブルからオントロジーへの対応
  • SPARQL Builder の改良(小林・レンツ・古崎・呉・山口)
    • 改良版 [1] パスのランキング機能,ラベル表示機能,パス数表示機能等追加
    • Linked Data 用のオントロジー (VoID) + SPARQL 1.1 用のオントロジー (Service Description) による SPARQL endpoint のメタデータ記述について標準化をすすめたい
      • EBI の Lodestar 用メタデータ記述
      • Bio2RDF の メタデータ記述 ([2], [3])
      • DBCLS/TPP で開発予定の SPARQL エンドポイント / RDF モデルのドキュメント・モデル図自動生成ツール
  • SPARQLTester - エンドポイントテスト用のスクリプトを公開(山本)

BioHackathon

参考リンク

参加者

  • 片山俊明(DBCLS)
  • 川島秀一(DBCLS)
  • 大田達郎(DBCLS)
  • 小林紀郎 (理研)
  • 山口敦子 (DBCLS)
  • 藤澤貴智(遺伝研)
  • 戀津魁 (理研)
  • 岡別府陽子(MSS)
  • 山中遼太(先端研)
  • 永野朗夫(PENQE)25日のみ
  • 千葉啓和(基生研)
  • 山田一作(野口研)
  • 小寺正明(東工大)
  • 山本泰智(DBCLS)
  • 森宙史(東工大)25日のみ
  • 山本希(東工大)26日のみ
  • 守屋勇樹(DBCLS)
  • 時松敏明(DBCLS)
  • 桝屋啓志(理研BRC)25日のみ
  • 高月照江(理研BRC) 
  • 市原寿子(かずさDNA研)
  • 木下聖子(創価大)25日のみ
  • 新町大輔(創価大)
  • 青木信行(創価大)
  • 櫻井望(かずさDNA研)25日のみ
  • 西出浩世(基生研)
  • 鈴木真也(東工大)25日のみ
  • 古崎晃司(大阪大)26日のみ
  • 櫛田達矢(NBDC)26日のみ
  • 畠中秀樹(NBDC)26日のみ
個人用ツール