SPARQLthon65
提供:TogoWiki
第65回 SPARQLthon を下記日程で開催したいと思います。
目次 |
開催概要
今回は別の研究会と日程が重なっているため、シャトルバスに乗りきれない可能性があります。その場合はタクシーもしくは公共バスをご利用ください。
RDFポータルと関連RDFストアが2月16日(金)16:30より停止しますのでご注意下さい (NBDC)。
- 開催期間:2018年 2月 15(木)- 16日(金)
- 開催場所:遺伝学研究所 生命情報研究センター棟 (DDBJ棟) 4F会議室 (W403-405)
- アクセス:http://dbcls.rois.ac.jp/access
- 遺伝研行きのシャトルバスがあります。乗り口は北口から出てロータリー向かって左手です。
- 新幹線ーNIGシャトルバス接続情報
- 9:30出発のシャトルバスに乗ってお越しいただくと、DDBJ棟までご案内します。
- 関東方面からお越しの方は こだま639号 (東京8:26発、品川8:34発) がスムーズです。
- 関西方面からお越しの方は こだま632号 (名古屋7:29発) がスムーズですが、朝が早いので前泊する方が楽です。
- お昼について
- 所内には小さい食堂がありますが、売店などはありません。お弁当などをお持ち頂くことをお勧めします。
- 参考: ランチスポット情報 [三島グルメ]
- 所内には小さい食堂がありますが、売店などはありません。お弁当などをお持ち頂くことをお勧めします。
- ホテルについて
- 駅の周りのホテル
- ホテル昭明館 http://showmeikan.com/ 南口。INSDCミーティング2017で使われたホテル
- ドーミーイン http://www.hotespa.net/hotels/mishima/ 南口。トレインビュー&富士山ビュー。温泉があります
- ホテルアルファワン http://www.alpha-1.co.jp/mishima/ 南口。INSDCミーティングの時に使ってるホテルその1
- ホテルマッシモ三島 http://www.massimo-m.jp 南口。INSDCミーティングの時に使ってるホテルその2
- 東横イン http://www.toyoko-inn.com/hotel/00215/ 北口。あんまりお店がない方(北口)だけど遺伝研行きシャトルバス乗り場に近い方
- 駅の周りのホテル
- 開催連絡:http://groups.google.com/group/biohackathon-jp メーリングリストにて
プロジェクト
TPP グループ全体
H29〜
- データサイエンスを加速させる微生物統合データベースの高度実用化開発 (黒川) - http://microbedb.jp/
- MeGAP解析アップロード→ファセット検索→ 比較解析スタンザ/ beta環境構築(藤澤、岡別府、渡辺)
- RDF→JSON:Elasticsearch検索インデックスデータ(藤澤)
- ファセットメニューTemperatureデータのOpenRefineでキュレーション
- MBGD関連引き継ぎ、今後の方針確認(千葉、加藤、内山)
- 糖鎖科学ポータルの構築 (木下)
- 糖タンパク質糖鎖のRDF修正(GlyConnectデータベースとの連携のため)、SPARQList-SPARQLet作成(山田)
- 糖タンパク質糖鎖データベース作成のため、UniProtからのタンパク質の糖鎖修飾データをSPARQListを利用してPythonで取得(Thukaa)
- 最新版のSPARQListをDockerでローカルに構築しテスト "params." 削除でOK。(山田)
- 糖鎖遺伝子のSNPデータを取得するプログラムを開発した(片山、木下)
- glycosmos.org ホームページの( 開発環境 )準備中・Stanza 導入(塩田、小野)
- 蛋白質構造データバンクのデータ検証高度化と統合化 (栗栖) - http://pdbj.org/
- 個体ゲノム時代に向けた植物ゲノム情報解析基盤の構築 (田畑) - http://pgdbj.jp/
- 疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オーミクスデータの統合 (菅野) - http://kero.hgc.jp/
- エピゲノミクス統合データベースの開発と機能拡充 (沖) - http://chip-atlas.org/
- ゲノム・疾患・医薬品のネットワークデータベース (金久) - http://www.kegg.jp/kegg/medicus/
継続中(〜H30)
- プロテオーム統合データベース:jPOST (石濱) - http://jpostdb.org/
- スキーマを変更したので、SPARQLを書き換える作業(守屋)
- DB インターフェース打ち合わせ(田中、守屋、吉沢、五斗)
- 生命動態システム科学のデータベースの統合化 (大浪)
〜H29
- 生命と環境のフェノーム統合データベース (桝屋)
- 生物種メタボロームモデル・データベースの構築 (有田)
- 個別化医療に向けたヒトゲノムバリエーションデータベース (徳永)
SPARQLthon グループ
- SPARQList(片山)
- 最新版では params. を廃止してパラメータはグローバル変数にしました
- NBDC RDF ポータルが叩けない…
- portal が SPARQList で使ってる multipart/form-data を弾いてる?ぽいです。一応、畠中さんに連絡済 ← あざっす!
- "(Content-Type: multipart/form-data は) すぐには追加できないそうです。対応の方針も含めて検討したいとのことですが、SPARQListは別のこちらの開発でも使うので何とかします。"(畠中さん談)
- LODチャレンジ
- 糖蛋白の座標取得 API お手伝い
- SPARQLetへのMetaStanza埋め込み
- SPARQL-support(守屋)
- SPARQList の仕様変更と、greasemonkeyの仕様変更に対応
- G2GML(松本、千葉、山中)
- v0.02 作成
- TogoVar(片山・川島・佐藤)
- vepのannotationをMongoにインポート中
(9000万doc...)-> 9000万行 / 2200万doc- 完了
- ClinVar, ExACのデータをマージ
- これから
- vepのannotationをMongoにインポート中
- 医科学RDF調査(熊谷、片山、川島)
- タンパク質をキーに、発現、局在、遺伝子変異等の情報のサブセットデータの作成着手
- LOD Surfer(山口、山本、古崎、桝屋、小林)
- Endpointクローラで以下の点を改善
- メタデータ( http://www.sparqlbuilder.org/doc/sbm_2015sep/ )を一律なものとはぜず、(1)DBのメタデータ(label, description, URL等の基本情報のみ、ただしVoidが公開されている場合のみ)、(2)クラス間の関係まで、(3)インスタンス数等の統計量も含む の3つの階層で出力できるようにクローラを変更
- クローラが途中でエラーを出した時、後でクロールし直すことができる機能の追加。まずはgraph単位でやり直しができるようにした。ただそれだと、大きなgraphをクロールする場合は落ちたところからやり直さないと実用に耐えないので、この問題に対応していく予定。(参考:メタデータ取得のための19種類のクエリ http://www.sparqlbuilder.org/doc/sparql-queries-for-sparql-builder-metadata/ )
- Endpointクローラで以下の点を改善
- 新着論文レビュー機能拡張のための辞書作成(小野・山本・大石・建石)
- LSD、Genesのエントリーを追加
- 抽出できる単語が約9200(国内版BH時)より約21000に増加
- 辞書のソースとなった用語集上でついているIDを出力できるようにした
- LSD、Genesのエントリーを追加
- 山本ログ
第6.5回AMEDハッカソン
- AMED ClinVar RDF(片山・川島・佐藤)
- XML -> JSON -> JSON-LD 化の方法も検討 SPARQLthon65/ClinVar_JSON-LD
- AMED ClinVar RDFから学習データ作成 (多湖)
- variant_typeが抜けているので追加をお願いしたい⇒佐藤さん
- 日本臨床腫瘍学会の診療ガイダンス のエビデンス表のRDF化(小柳)
- 前回報告した全体のスキーマについては、明日の打ち合わせで調整予定
- EXON領域を示すために、前回のAMEDハッカソン終わりに川島先生から教えていただいた、EnsemblのENSEから始まるIDを使用
- ICGC(山中)
- med2rdf に 移行 しました。Docker 化を進めています。
- med2rdf ontology の開発(川島)
- http://med2rdf.org/ontology/med2rdf# 生成スクリプト(片山)
今後の予定
- 3/5-9 International Life Science Integration Workshop(東京・中野サンプラザ)
- 3/8-10 SIG-MBI, オープンバイオ研究会, SIG-BIO @ 北陸先端科学技術大学院大学(石川)
- 3/19-23 RDF summit 3 @ 京都大学 (京都)
参考リンク
- これまでの SPARQLthon
参加者
- 片山俊明 (DBCLS)
- 川島秀一 (DBCLS)
- 山本泰智 (DBCLS)
- 守屋勇樹 (DBCLS)
- 坊農秀雅 (DBCLS)
- 岡別府陽子 (MSS)
- 山中遼太 (Oracle)
- 吉沢明康 (京都大学)
- 永野朗夫(penqe)
- 佐藤大輔(レベルファイブ)
- 松本翔太(レベルファイブ)15日のみ
- 大田達郎 (DBCLS)
- 大石直哉(DOGRUN)
- 山田一作(野口研究所)
- 千葉啓和(DBCLS)
- 多湖真一郎(富士通研)
- 小柳祐介(富士通研)
- 内藤雄樹(DBCLS)
- 仲里猛留(DBCLS)
- 五斗進(DBCLS)15日のみ
- 木下聖子(創価大)16日のみ
- 細田正恵(創価大)16日のみ
- 塩田正明(創価大)
- 小野多美子(創価大)
- Kuoka Thukaa(創価大)
- 大村宗寛(Gsearch)
- 杉山博一(Gsearch)15日のみ
- 田中聡 (Trans-IT)
- 藤澤貴智(遺伝研)
- 熊谷禎洋(日立) 15日のみ
- 小林紀郎(理研)
- 建石由佳(NBDC)16日のみ