SPARQLthon65

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
(参加者)
(SPARQLthon グループ)
 
(間の57版分が非表示)
4行: 4行:
'''今回は別の研究会と日程が重なっているため、シャトルバスに乗りきれない可能性があります。その場合はタクシーもしくは公共バスをご利用ください。'''
'''今回は別の研究会と日程が重なっているため、シャトルバスに乗りきれない可能性があります。その場合はタクシーもしくは公共バスをご利用ください。'''
 +
 +
'''RDFポータルと関連RDFストアが2月16日(金)16:30より停止しますのでご注意下さい (NBDC)。'''
* 開催期間:2018年 2月 15(木)- 16日(金)
* 開催期間:2018年 2月 15(木)- 16日(金)
31行: 33行:
==== H29〜 ====
==== H29〜 ====
* [https://research-er.jp/projects/view/965239 データサイエンスを加速させる微生物統合データベースの高度実用化開発] (黒川) - http://microbedb.jp/
* [https://research-er.jp/projects/view/965239 データサイエンスを加速させる微生物統合データベースの高度実用化開発] (黒川) - http://microbedb.jp/
 +
** MeGAP解析アップロード→ファセット検索→ 比較解析スタンザ/ beta環境構築(藤澤、岡別府、渡辺)
 +
** RDF→JSON:Elasticsearch検索インデックスデータ(藤澤)
 +
*** ファセットメニューTemperatureデータのOpenRefineでキュレーション
 +
** MBGD関連引き継ぎ、今後の方針確認(千葉、加藤、内山)
* [http://wiki.lifesciencedb.jp/mw/TPP2-kinoshita 糖鎖科学ポータルの構築] (木下)
* [http://wiki.lifesciencedb.jp/mw/TPP2-kinoshita 糖鎖科学ポータルの構築] (木下)
 +
** 糖タンパク質糖鎖のRDF修正(GlyConnectデータベースとの連携のため)、SPARQList-SPARQLet作成(山田)
 +
** 糖タンパク質糖鎖データベース作成のため、UniProtからのタンパク質の糖鎖修飾データをSPARQListを利用してPythonで取得(Thukaa)
 +
** 最新版のSPARQListをDockerでローカルに構築しテスト "params." 削除でOK。(山田)
 +
** 糖鎖遺伝子のSNPデータを取得するプログラムを開発した(片山、木下)
 +
** glycosmos.org ホームページの( 開発環境 )準備中・Stanza 導入(塩田、小野)
* [https://research-er.jp/projects/view/965238 蛋白質構造データバンクのデータ検証高度化と統合化] (栗栖) - http://pdbj.org/
* [https://research-er.jp/projects/view/965238 蛋白質構造データバンクのデータ検証高度化と統合化] (栗栖) - http://pdbj.org/
* [https://research-er.jp/projects/view/965241 個体ゲノム時代に向けた植物ゲノム情報解析基盤の構築] (田畑) - http://pgdbj.jp/
* [https://research-er.jp/projects/view/965241 個体ゲノム時代に向けた植物ゲノム情報解析基盤の構築] (田畑) - http://pgdbj.jp/
41行: 52行:
==== 継続中(〜H30) ====
==== 継続中(〜H30) ====
* [[TPP-ishihama|プロテオーム統合データベース:jPOST]] (石濱) - http://jpostdb.org/
* [[TPP-ishihama|プロテオーム統合データベース:jPOST]] (石濱) - http://jpostdb.org/
 +
** スキーマを変更したので、SPARQLを書き換える作業(守屋)
 +
** DB インターフェース打ち合わせ(田中、守屋、吉沢、五斗)
* [[TPP-onami|生命動態システム科学のデータベースの統合化]] (大浪)
* [[TPP-onami|生命動態システム科学のデータベースの統合化]] (大浪)
49行: 62行:
=== SPARQLthon グループ ===
=== SPARQLthon グループ ===
 +
 +
* SPARQList(片山)
 +
** 最新版では params. を廃止してパラメータはグローバル変数にしました
 +
** NBDC RDF ポータルが叩けない…
 +
*** portal が SPARQList で使ってる multipart/form-data を弾いてる?ぽいです。一応、畠中さんに連絡済 ← あざっす!
 +
*** "(Content-Type: multipart/form-data は) すぐには追加できないそうです。対応の方針も含めて検討したいとのことですが、SPARQListは別のこちらの開発でも使うので何とかします。"(畠中さん談)
 +
** LODチャレンジ
 +
** 糖蛋白の座標取得 API お手伝い
 +
*** GRCh38 http://dev.togogenome.org/rest/hgnc_position
 +
*** GRCh37 http://dev.togogenome.org/rest/hgnc_position_hg19
 +
** SPARQLetへのMetaStanza埋め込み
 +
*** http://dev.togogenome.org/rest/so_tree
 +
* SPARQL-support(守屋)
 +
** SPARQList の仕様変更と、greasemonkeyの仕様変更に対応
 +
* G2GML(松本、千葉、山中)
 +
** [https://github.com/g2gml/g2gml v0.02] 作成
 +
* TogoVar(片山・川島・佐藤)
 +
** vepのannotationをMongoにインポート中 <strike>(9000万doc...)</strike> -> 9000万行 / 2200万doc
 +
*** 完了
 +
** ClinVar, ExACのデータをマージ
 +
*** これから
 +
* 医科学RDF調査(熊谷、片山、川島)
 +
** タンパク質をキーに、発現、局在、遺伝子変異等の情報のサブセットデータの作成着手
 +
* LOD Surfer(山口、山本、古崎、桝屋、小林)
 +
** Endpointクローラで以下の点を改善
 +
*** メタデータ( http://www.sparqlbuilder.org/doc/sbm_2015sep/ )を一律なものとはぜず、(1)DBのメタデータ(label, description, URL等の基本情報のみ、ただしVoidが公開されている場合のみ)、(2)クラス間の関係まで、(3)インスタンス数等の統計量も含む の3つの階層で出力できるようにクローラを変更
 +
*** クローラが途中でエラーを出した時、後でクロールし直すことができる機能の追加。まずはgraph単位でやり直しができるようにした。ただそれだと、大きなgraphをクロールする場合は落ちたところからやり直さないと実用に耐えないので、この問題に対応していく予定。(参考:メタデータ取得のための19種類のクエリ http://www.sparqlbuilder.org/doc/sparql-queries-for-sparql-builder-metadata/ )
 +
* 新着論文レビュー機能拡張のための辞書作成(小野・山本・大石・建石)
 +
** LSD、Genesのエントリーを追加
 +
*** 抽出できる単語が約9200(国内版BH時)より約21000に増加
 +
** 辞書のソースとなった用語集上でついているIDを出力できるようにした
 +
* 山本ログ
 +
** [https://twitter.com/yayamamo/status/964324464325378048 ARQのJavaScript独自関数拡張機能の紹介]
 +
** [https://twitter.com/yayamamo/status/965413419682734080 SQLインジェクション誤判定問題の発見]
 +
 +
=== [https://docs.google.com/document/d/1BgQbLT_1FoXvngJFGHdTHNMEkzGzYpY_orbpp0ABM_Q/edit 第6.5回AMEDハッカソン] ===
 +
 +
* AMED ClinVar RDF(片山・川島・佐藤)
 +
** XML -> JSON -> JSON-LD 化の方法も検討 [[SPARQLthon65/ClinVar_JSON-LD]]
 +
* AMED ClinVar RDFから学習データ作成 (多湖)
 +
** variant_typeが抜けているので追加をお願いしたい⇒佐藤さん
 +
* [http://www.jsmo.or.jp/about/kanko.html#guideline 日本臨床腫瘍学会の診療ガイダンス] のエビデンス表のRDF化(小柳)
 +
** 前回報告した全体のスキーマについては、明日の打ち合わせで調整予定
 +
** EXON領域を示すために、前回のAMEDハッカソン終わりに川島先生から教えていただいた、EnsemblのENSEから始まるIDを使用
 +
* ICGC(山中)
 +
** med2rdf に [https://github.com/med2rdf/icgc 移行] しました。Docker 化を進めています。
 +
* med2rdf ontology の開発(川島)
 +
** http://med2rdf.org/ontology/med2rdf# 生成スクリプト(片山)
=== 今後の予定 ===
=== 今後の予定 ===
 +
 +
* 3/5-9 [http://glic.glycoinfo.org/meetings/LSworkshop2018/  International Life Science Integration Workshop](東京・中野サンプラザ)
 +
* 3/8-10 [http://www.sigmbi.jp/ SIG-MBI], [https://github.com/open-bio-japan/website/wiki/meeting22 オープンバイオ研究会], [http://www.ipsj.or.jp/kenkyukai/event/bio53.html SIG-BIO] @ 北陸先端科学技術大学院大学(石川)
 +
** [http://bioinfo.ec.t.kanazawa-u.ac.jp/~ken/sigmbi/reserve.html 参加申し込みページはこちら]
 +
* 3/19-23 [https://github.com/dbcls/rdfsummit3 RDF summit 3] @ 京都大学 (京都)
== 参考リンク ==
== 参考リンク ==
86行: 152行:
* 田中聡 (Trans-IT)
* 田中聡 (Trans-IT)
* 藤澤貴智(遺伝研)
* 藤澤貴智(遺伝研)
 +
* 熊谷禎洋(日立) 15日のみ
 +
* 小林紀郎(理研)
 +
* 建石由佳(NBDC)16日のみ

2018年2月19日 (月) 02:35時点における最新版

第65回 SPARQLthon を下記日程で開催したいと思います。

目次

開催概要

今回は別の研究会と日程が重なっているため、シャトルバスに乗りきれない可能性があります。その場合はタクシーもしくは公共バスをご利用ください。

RDFポータルと関連RDFストアが2月16日(金)16:30より停止しますのでご注意下さい (NBDC)。

  • 開催期間:2018年 2月 15(木)- 16日(金)
  • 開催場所:遺伝学研究所 生命情報研究センター棟 (DDBJ棟) 4F会議室 (W403-405)
  • アクセス:http://dbcls.rois.ac.jp/access
    • 遺伝研行きのシャトルバスがあります。乗り口は北口から出てロータリー向かって左手です。
    • 新幹線ーNIGシャトルバス接続情報
    • 9:30出発のシャトルバスに乗ってお越しいただくと、DDBJ棟までご案内します。
      • 関東方面からお越しの方は こだま639号 (東京8:26発、品川8:34発) がスムーズです。
      • 関西方面からお越しの方は こだま632号 (名古屋7:29発) がスムーズですが、朝が早いので前泊する方が楽です。
  • お昼について
    • 所内には小さい食堂がありますが、売店などはありません。お弁当などをお持ち頂くことをお勧めします。
  • ホテルについて

プロジェクト

TPP グループ全体

H29〜

継続中(〜H30)

〜H29

SPARQLthon グループ

  • SPARQList(片山)
    • 最新版では params. を廃止してパラメータはグローバル変数にしました
    • NBDC RDF ポータルが叩けない…
      • portal が SPARQList で使ってる multipart/form-data を弾いてる?ぽいです。一応、畠中さんに連絡済 ← あざっす!
      • "(Content-Type: multipart/form-data は) すぐには追加できないそうです。対応の方針も含めて検討したいとのことですが、SPARQListは別のこちらの開発でも使うので何とかします。"(畠中さん談)
    • LODチャレンジ
    • 糖蛋白の座標取得 API お手伝い
    • SPARQLetへのMetaStanza埋め込み
  • SPARQL-support(守屋)
    • SPARQList の仕様変更と、greasemonkeyの仕様変更に対応
  • G2GML(松本、千葉、山中)
  • TogoVar(片山・川島・佐藤)
    • vepのannotationをMongoにインポート中 (9000万doc...) -> 9000万行 / 2200万doc
      • 完了
    • ClinVar, ExACのデータをマージ
      • これから
  • 医科学RDF調査(熊谷、片山、川島)
    • タンパク質をキーに、発現、局在、遺伝子変異等の情報のサブセットデータの作成着手
  • LOD Surfer(山口、山本、古崎、桝屋、小林)
    • Endpointクローラで以下の点を改善
      • メタデータ( http://www.sparqlbuilder.org/doc/sbm_2015sep/ )を一律なものとはぜず、(1)DBのメタデータ(label, description, URL等の基本情報のみ、ただしVoidが公開されている場合のみ)、(2)クラス間の関係まで、(3)インスタンス数等の統計量も含む の3つの階層で出力できるようにクローラを変更
      • クローラが途中でエラーを出した時、後でクロールし直すことができる機能の追加。まずはgraph単位でやり直しができるようにした。ただそれだと、大きなgraphをクロールする場合は落ちたところからやり直さないと実用に耐えないので、この問題に対応していく予定。(参考:メタデータ取得のための19種類のクエリ http://www.sparqlbuilder.org/doc/sparql-queries-for-sparql-builder-metadata/ )
  • 新着論文レビュー機能拡張のための辞書作成(小野・山本・大石・建石)
    • LSD、Genesのエントリーを追加
      • 抽出できる単語が約9200(国内版BH時)より約21000に増加
    • 辞書のソースとなった用語集上でついているIDを出力できるようにした
  • 山本ログ

第6.5回AMEDハッカソン

  • AMED ClinVar RDF(片山・川島・佐藤)
  • AMED ClinVar RDFから学習データ作成 (多湖)
    • variant_typeが抜けているので追加をお願いしたい⇒佐藤さん
  • 日本臨床腫瘍学会の診療ガイダンス のエビデンス表のRDF化(小柳)
    • 前回報告した全体のスキーマについては、明日の打ち合わせで調整予定
    • EXON領域を示すために、前回のAMEDハッカソン終わりに川島先生から教えていただいた、EnsemblのENSEから始まるIDを使用
  • ICGC(山中)
    • med2rdf に 移行 しました。Docker 化を進めています。
  • med2rdf ontology の開発(川島)

今後の予定

参考リンク

参加者

  • 片山俊明 (DBCLS)
  • 川島秀一 (DBCLS)
  • 山本泰智 (DBCLS)
  • 守屋勇樹 (DBCLS)
  • 坊農秀雅 (DBCLS)
  • 岡別府陽子 (MSS)
  • 山中遼太 (Oracle)
  • 吉沢明康 (京都大学)
  • 永野朗夫(penqe)
  • 佐藤大輔(レベルファイブ)
  • 松本翔太(レベルファイブ)15日のみ
  • 大田達郎 (DBCLS)
  • 大石直哉(DOGRUN)
  • 山田一作(野口研究所)
  • 千葉啓和(DBCLS)
  • 多湖真一郎(富士通研)
  • 小柳祐介(富士通研)
  • 内藤雄樹(DBCLS)
  • 仲里猛留(DBCLS)
  • 五斗進(DBCLS)15日のみ
  • 木下聖子(創価大)16日のみ
  • 細田正恵(創価大)16日のみ
  • 塩田正明(創価大)
  • 小野多美子(創価大)
  • Kuoka Thukaa(創価大)
  • 大村宗寛(Gsearch)
  • 杉山博一(Gsearch)15日のみ
  • 田中聡 (Trans-IT)
  • 藤澤貴智(遺伝研)
  • 熊谷禎洋(日立) 15日のみ
  • 小林紀郎(理研)
  • 建石由佳(NBDC)16日のみ
個人用ツール