SPARQLthon33

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
(SPARQLthon グループ)
(SPARQLthon グループ)
105行: 105行:
*** Cytoscape 用の表示スクリプトを生成する Java Application
*** Cytoscape 用の表示スクリプトを生成する Java Application
*** 前提: java 1.8以降, jena (TDB), Cytoscape トリプルストア推奨: fuseki OS推奨: Linux (他のOSだとスクリプトに手を入れる必要がある)
*** 前提: java 1.8以降, jena (TDB), Cytoscape トリプルストア推奨: fuseki OS推奨: Linux (他のOSだとスクリプトに手を入れる必要がある)
 +
* 化合物関連データ(山田)
 +
** [http://www.ebi.ac.uk/chebi/aboutChebiForward.do ChEBIのライセンス] [https://creativecommons.org/licenses/by/3.0/ Creative Commons License]
 +
** 化合物データベース(日化辞RDF、KNApSAcK、ChEBI)の調査
 +
*** InChIを基に、データベース間のIDリンク情報を調査する。
 +
**** InChIは、複数のレイヤーを用いて記載されている。
 +
<pre>
 +
InChI=1S/<メインレイヤー>化学式/原子の繋がり/水素原子</メインレイヤー>/<電荷レイヤー>プロトンサブレイヤー(p)/電荷サブレイヤー(q)</電荷レイヤー>/
 +
<立体化学レイヤー>/二重結合とクムレン(b)/原子の四面体配置とアレーン(t,m)/立体化学の種類の情報(s)/<立体化学レイヤー>/<同位体レイヤー>(i,h,b,t,m,s)</同位体レイヤー>
 +
</pre>
 +
: L-アスコルビン酸: InChI=1S/C6H8O6/c7-1-2(8)5-3(9)4(10)6(11)12-5/h2,5,7-8,10-11H,1H2/t2-,5+/m0/s1
 +
: 立体化学情報以降のレイヤーを除いたL-アスコルビン酸のInChIの部分文字列: InChI=1S/C6H8O6/c7-1-2(8)5-3(9)4(10)6(11)12-5/h2,5,7-8,10-11H,1H2/
=== 今後の予定 ===
=== 今後の予定 ===

2015年6月23日 (火) 02:41時点における版

第33回 SPARQLthon を下記日程で開催したいと思います。

目次

開催概要

プロジェクト

TPP グループ全体

  • ゲノム・メタゲノム情報統合による微生物DBの超高度化推進 (黒川)
    • Microbe DB で利用する Genome RDF を(TogoGenomeゲノムセットとMBGDのオーソログデータとの対応)を確定してトーゴーの日に備える
    • MeGAP の完成度を高める - アップロードする配列に関するメタデータ(温度など DRA で必要な項目 etc.)を入力可能にした (森)
    • 病原性遺伝子を RDF データに追加して、どの菌株に所属するかを DB 化 (山本)
  • 植物ゲノム情報活用のための統合研究基盤の構築 (田畑)
    • トマトの物理地図/マーカー/ゲノム情報 (GFF3) を jBrowse で表示する (BioInterchange 1.0のGFF3→RDFコンバータのfixが必要)
      • PGDBj/SGM のマーカーデータの FALDO を使った RDF 化 → jBrowse で検証 (市原/片山)
    • 植物病害キュレーションの自動化に PubAnnotation/PubDictionaries/TextAE を利用するための打ち合わせ (市原)
  • 生命と環境のフェノーム統合データベース (桝屋)
    • マウスゲノムの NGS データのメタデータを作成
      • SRA の RDF スキーマを検討し、XMLからRDF変換したミニマムなスキーマを試作するとに (桝屋/大田/川島/藤澤/森/小林)
    • WDCM http://www.wdcm.org/ - ATCC 以外のほとんどの菌株コレクションが加盟しているコンソーシアム
      • これまでに作成した RDF / オントロジーを WDCM で採用できるとよい (川島/森/桝屋)
      • アジアのリソースセンター ANRRC から RDF で情報共有を始め、世界の菌株コレクション WFCC にプッシュする方向で
    • マウスの細胞のデータの RDF 化 (高月)
  • 糖鎖統合データベースおよび国際糖鎖構造リポジトリの開発 (成松)
  • 生命動態システム科学のデータベースの統合化(大浪)
    • 線虫/ハエ/ゼブラ/一分子動態などの動画から画像処理でエッジ抽出などしたDBのメタデータを RDF で整備
      • 理研のメタデータベースに収録できるように RDF 化の方針が決まった (京田)
  • RDF ポータル
    • データセットのリストの仕方、カテゴリ、つながりなどをどのように表現するか検討 (永野/川島/片山/畠中)
    • データ提出方法について (櫛田)
      • 現状のプラン:FTP サーバにおいていただく
      • 要望:HDD を送りつけたい、取りにきてほしい、WebからHTTPで取っていってほしい
      • 疑問点:
        • 大量の RDF がある場合個別のRDFのメタデータをどのように分けて記述するのがよいか
        • 容量の大きそうなもの TogoGenome, MBGD, Metagenome, ....
        • 理研リソースセンターのデータは商品なので古いデータを放置できないため自動更新できるようにしたい

SPARQLthon グループ

  • お花見メタゲノムのメタデータの整備 (大田)
    • 環境情報をオントロジーにマッピングしたい
    • 緯度経度などから過去の気象情報とマッピング
    • 表現系の自由記述を標準化
  • がんゲノム (山中)
    • D2RQ Mapper の機能追加リクエスト
      • クラス定義 (map:donor a d2rq:ClassMap; d2rq:class <Donor>;)
      • データベースがオフラインでも編集機能?マッピングファイルの読込機能?
      • Namespaceとして定義してもマッピングファイルのPrefixに出てこないバグ?(up-ensembl)
    • ICGC Linked Data Portal で発行したクエリがわかるように d3sparql の各グラフに SPARQL 確認ボタンを追加
  • PIERO(小寺、守屋、時松)http://wiki.lifesciencedb.jp/mw/PIERO
    • 酵素反応の部分的な特徴の記述(酵素反応中の化学部分構造変換とその語彙など)
    • データの整備と使用例について
      • RDF化ガイドラインに沿う形に
      • PIERO reaction ontology, PIERO transformation ontology, PIERO substructure ontology の三部構成にする案
      • PIEROオントロジーを表す piero: と、データ間関係を表す piero-link (pink:) に分離する案
    • データベースをどのようにスタンザ等で見れたら嬉しいのか?
      • EC番号(または遺伝子)を入力すると、EC番号だけでは共通点を見いだせないが反応パターン(RPまたはRCまたはRDM)を共有する他のEC番号(または遺伝子)をリストアップする、とか。
  • Docker
    • NGSデータ解析ツールのDocker化とその環境づくり(坊農)
      • DRAに登録されたRNA-seqデータはGEOに入らないものを補完する「発現データ補完計画」
  • NBDC DBカタログ (信定)
    • ダウンロード可能な DB かどうかなどのメタデータを追記 http://integbio.jp/dbcatalog/?lang=ja
    • 理研メタデータベースでも DB カタログの RDF スキーマを継承しているので今後も揃えたい
      • 理研の RDF データはホスティングも可能 - Ontology/RDFガイドライン標準化委員会
  • GGGenome に INSDC 検索を取り込む, AWS で稼働できるか実験 (内藤)
  • ニッカジのRDFデータの改善準備 (櫛田)
  • TogoGenome
    • リファレンスとなるゲノムデータセットの完備
    • テキスト検索のデプロイ
    • 真核を活かしたスタンザ、比較ゲノムなどトーゴーの日までのゴールを明確化
  • RDFビューワ調査(山口,山本)
    • RDF2Graphの調査(山口)
      • Cytoscape 用の表示スクリプトを生成する Java Application
      • 前提: java 1.8以降, jena (TDB), Cytoscape トリプルストア推奨: fuseki OS推奨: Linux (他のOSだとスクリプトに手を入れる必要がある)
  • 化合物関連データ(山田)
    • ChEBIのライセンス Creative Commons License
    • 化合物データベース(日化辞RDF、KNApSAcK、ChEBI)の調査
      • InChIを基に、データベース間のIDリンク情報を調査する。
        • InChIは、複数のレイヤーを用いて記載されている。
InChI=1S/<メインレイヤー>化学式/原子の繋がり/水素原子</メインレイヤー>/<電荷レイヤー>プロトンサブレイヤー(p)/電荷サブレイヤー(q)</電荷レイヤー>/
<立体化学レイヤー>/二重結合とクムレン(b)/原子の四面体配置とアレーン(t,m)/立体化学の種類の情報(s)/<立体化学レイヤー>/<同位体レイヤー>(i,h,b,t,m,s)</同位体レイヤー>
L-アスコルビン酸: InChI=1S/C6H8O6/c7-1-2(8)5-3(9)4(10)6(11)12-5/h2,5,7-8,10-11H,1H2/t2-,5+/m0/s1
立体化学情報以降のレイヤーを除いたL-アスコルビン酸のInChIの部分文字列: InChI=1S/C6H8O6/c7-1-2(8)5-3(9)4(10)6(11)12-5/h2,5,7-8,10-11H,1H2/

今後の予定

参考リンク


参加者

  • 片山俊明 (DBCLS)
  • 川島秀一 (DBCLS)
  • 守屋勇樹 (DBCLS)
  • 小林紀郎 (理研)
  • 小澤健太郎 (SGI)
  • 上原英也 (SGI) 23日のみ
  • 坊農秀雅 (DBCLS)
  • 山中遼太 (先端研)
  • 山本泰智 (DBCLS)
  • 大石直哉 (DOGRUN)
  • 岡別府陽子 (MSS)
  • 時松敏明 (DBCLS) 22日午後から
  • 永野朗夫 (PENQE)
  • 藤澤貴智(遺伝研)
  • 京田耕司(RIKEN QBiC)
  • 櫛田達矢(NBDC)
  • 畠中秀樹(NBDC)
  • 信定知江(NBDC)
  • 桝屋啓志 (RIKEN BRC)22日のみ
  • 高月照江 (RIKEN BRC)
  • 戀津魁 (理研)
  • 山田一作 (野口研)23日のみ
  • 市原寿子 (かずさDNA研)
  • 山口敦子 (DBCLS)
  • 千葉啓和(基生研)
  • 森宙史(東工大)
  • 仲里猛留(DBCLS)22日のみ
  • 山本希(東工大)22日のみ
  • 小寺正明(東工大)22日のみ
  • 内藤雄樹 (DBCLS)
  • 新町大輔 (創価大)22日のみ
個人用ツール