SPARQLthon25
提供:TogoWiki
第25回 SPARQLthon を下記日程で開催したいと思います。
目次 |
開催概要
- 開催期間:10月27日(月) 10:00 〜 28日(火) 18:00
- 開催場所:ライフサイエンス統合データベースセンター (DBCLS) @ 東京大学 柏の葉キャンパス駅前 サテライト 6階
- アクセス:http://dbcls.rois.ac.jp/access
- 開催連絡:http://groups.google.com/group/biohackathon-jp メーリングリストにて
プロジェクト
TPP グループ全体
- 生物種メタボロームモデル・データベースの構築 (有田)
- MassBankでは7個のJava Appletを使用しているが、Java8 からソケットエラーが出るようになった。(現在は Java7 もサポートがあり、Java7では問題ない。)
java.security.AccessControlException: access denied ("java.net.SocketPermission" "massbank.ufz.de:80" "connect,resolve")
当初はJavaのセキュリティーポリシーの変更かと思ってウェブサイト等もよく読んだのですが、Java7 から 8 での変更点は殆んどありません。
検討の結果、見出した原因は「署名されたAppletからアクセスされるサーバー名は、ブラウザ上のサーバー名と同一でないと駄目」 というものでした。Java7までは例えばVirtualHost設定で同一サーバーが許す別の名前でアクセスしても大丈夫だったのですが(具体的には www.massbank.jp のかわりに massbank.jp )、Java8からはサーバー名のwwwまで同じでないと駄目になっています。そのためアドレス名のredirect設定をおこなって解決出来ました。アドレス名で www がなくても良いようにしているサイトや別名を持っているサイトは多いはずなので、多くの人がこの問題に接していると思います。これからドイツ側のサーバーにも設定変更を依頼します。(有田)
対処法: 以下のコードを VirtualHost設定内側の先頭に置く。
RewriteEngine On RewriteCond %{HTTP_HOST} ^massbank\.jp$ [NC] RewriteRule (.*) http://www.massbank.jp$1 [R=301,L]
- 疾患ヒトゲノム変異の生物学的機能注釈を目指した多階層オミクスデータの統合 (菅野)
- D2RQ のマッピングを進める、この際の URI (ID) をどうするかなど検討(河野・鈴木)
- URIをどうするか決める
- できるだけ汎用ののclass, predicateを探す
- なければ作る(binなど)
- NBDC より菅野-徳永連携を依頼されている。オントロジーの共通化など(河野)
- D2RQ のマッピングを進める、この際の URI (ID) をどうするかなど検討(河野・鈴木)
- 生命と環境のフェノーム統合データベース (桝屋)
- バイオリソースを記述する際のプロパティを検討し、独自開発or既存オントロジー利用を考える(高月)
- ゲノム・メタゲノム情報統合による微生物DBの超高度化推進 (黒川)
- オーソログと感染症連携の SPARQL 開発(千葉)
- PDO (Pathogenic Disease Ontology) のスタンザ構想(山本)
- 糖鎖統合データベースおよび国際糖鎖構造リポジトリの開発 (成松)
- 桝屋さんに産総研の糖鎖遺伝子KOマウスのデータを渡すことになっていますので、その準備が出来次第、送る(木下・山田)
- 植物ゲノム情報活用のための統合研究基盤の構築 (田畑)
- 植物病害データで RDF 化作業と修正(市原)
SPARQLthon グループ
- ICD-10のRDF(ttl形式)の修正とUMLS CUI のマッピング(伊藤)
- ICD-10: BioPortal で ICD-10 の RDF が研究目的には利用可能
- もともと WHO の ICD-10 は XML/text だが再配布できないライセンス
- UMLS (Unified Medical Language System): アメリカ医学図書館の医学体系(用語マッピング)
- Bio2RDF の SIDER(副作用のDB)のデータと ICD-10 のマッピングをしたい
- 最終的には医薬基盤研の RDF 化したデータと連携したい
- ICD-10: BioPortal で ICD-10 の RDF が研究目的には利用可能
- SPARQL Builder(小林)
- ISWC の結果を踏まえて実用性向上のための実装(具体的なデータを用いた評価をする)
- GUI の改良とそれに向けたサーブレットの改良(魁,山口)
- クラスリストを「URI 」のリストから「クラスラベル+インスタンス数」のリストに変更
- メタデータ管理方法の検討(小林,山本,呉)
- ファイルで管理する方法からトリプルストアで管理するように(VIrtuoso7)
- DDBJ オントロジー(藤沢)
- 最新版のオントロジーで DDBJ/RDF データの構築
- ロード時に十分メモリ (800GB) を確保しないと、ある量を超えるとインポートが止まる。
- BioInterchange との連携(BH14で?)
- スキーマ図 TPP-Ontology (片山)
- 最新版のオントロジーで DDBJ/RDF データの構築
- 可視化(大田)
- 目標: SPARQLエンドポイントに入っているRDFモデル図を自動生成する
- 先に可視化モジュールを作って、メタデータのインポート部分をあとでごにょっとする
- 案「REST APIを叩き続ければ可視化ができる」的フレームワークを作ればいいのでは?
- こんなものがあった => http://yuml.me/diagram/class/samples
- EBI BioSampleのRDFモデルの一部をこれで可視化してみた =>http://tinyurl.com/k9h6ftq
- こんな風に書きます: [biosd:sample/SAME001;rdfs:label Sample 1{bg:lightskyblue}]-biosd-terms:has-biological-characteristic>[biosd:exp-prop-val/sub1#6c71;rdfs:label Mus Musculus{bg:lightskyblue}],[biosd:exp-prop-val/sub1#6c71;rdfs:label Mus Musculus{bg:lightskyblue}]-biosd-terms:has-biological-charactersitic-type>[biosd:exp-prop-type/sub1#6c71:1;rdfs:label Mus Musculus{bg:lightskyblue}],[biosd:exp-prop-val/sub1#6c71;rdfs:label Mus Musculus{bg:lightskyblue}]-biosd-terms:has-biological-characteristic-type>[biosd:exp-prop-type/sub1#6c71;rdfs:label Organism{bg:lightskyblue}],[biosd:exp-prop-val/sub1#6c71;rdfs:label Mus Musculus{bg:lightskyblue}]-^[efo:experimental factor{bg:cyan}],[biosd:exp-prop-type/sub1#6c71:1;rdfs:label Mus Musculus{bg:lightskyblue}]-^[efo:experimental factor{bg:cyan}],[biosd:exp-prop-type/sub1#6c71;rdfs:label Organism{bg:lightskyblue}]-^[efo:experimental factor{bg:cyan}],[biosd:exp-prop-type/sub1#6c71:1;rdfs:label Mus Musculus{bg:lightskyblue}]-^[ncbi:NCBITaxon_10090;rdfslabel Mus Musculus{bg:cyan}],[inferred by ZOOMA{bg:orange}]-.->[biosd:exp-prop-type/sub1#6c71:1;rdfs:label Mus Musculus{bg:lightskyblue}],[As per original label{bg:orange}]-.->[biosd:exp-prop-type/sub1#6c71;rdfs:label Organism{bg:lightskyblue}]
- しんどい
- 煩雑な新しいコーディングルールを作るよりもD3jsを書いてもらう方がむしろ楽なのでは?
- D3jsはパーツが小さすぎるのでレゴブロック的に組み合わせて可視化ができる、的ラッパーを目指すのがよさそう。
- 案「REST APIを叩き続ければ可視化ができる」的フレームワークを作ればいいのでは?
- 目的/用途と目指す方向をもうちょっと議論する必要あり。
- プロトタイプ作成の前に可視化ルールについて調査/議論する必要がある
- TogoGenome
- 更新した表現系のデータをインポートする(川島)
- 生物種リスト・遺伝子リストのスタンザ(守屋)
- テキスト検索 SPARQL 開発(岡別府)
- データ更新系のリファイン(片山・岡別府)
- 化合物
- DOI や PMID がつかない文献の RDF 化をどう進めるか検討(時松)
- SPARQLthon23の櫛田さんの検討をの続きで、KNApSAcK文献のDOIがつかないものがどの程度あるか検討。
- 延べ引用文献13万弱(重複除去して2万前後か?)から、雑誌の種類をできるだけ平準化して2000強を抽出して、DOI付与の可否を検討。
- 700程度見た段階で、DOI付与率は25%弱。
- DOIが付与されない雑誌リストができるので、今後の対応については櫛田さんなどと検討することに。
- 書籍については別途リスト化して、今後検討
- SPARQLthon23の櫛田さんの検討をの続きで、KNApSAcK文献のDOIがつかないものがどの程度あるか検討。
- 単糖?天然物/単糖(山田)
- DOI や PMID がつかない文献の RDF 化をどう進めるか検討(時松)
- SPARQL 本
- 粛々と書く(加藤・岡別府・川島・山本・片山)
- SPARQLtest / TripleDataProfiler / SPARQLtester (山本)
- がんゲノム -- 体細胞変異データの正規化とD2RQマッピングの作成(山中)
TODO
- 2015/1- 以降の日程調整
- BH14.14 とオープンバイオの日程・場所調整
参考リンク
- これまでの SPARQLthon
参加者
- 片山俊明(DBCLS)
- 川島秀一(DBCLS)
- 小林紀郎 (理研)
- 山本泰智(DBCLS)
- 守屋勇樹 (DBCLS)
- 市原寿子 (かずさ)
- 岡別府陽子(MSS)
- 伊藤真和吏(NIBIO)
- 大田達郎(DBCLS)
- 藤澤貴智(遺伝研)
- 山口敦子 (DBCLS)
- 永野朗夫 (PENQE) 27日のみ
- 有田正規 (遺伝研) 27日のみ
- 諏訪和大 (リオレクト) 27日のみ
- 高月照江 (理研BRC)
- 桝屋啓志 (理研BRC)27日のみ
- 山本希(東工大)
- 千葉啓和(基生研)27日のみ
- 時松敏明 (DBCLS)
- 戀津魁 (理研)
- 山田一作(野口研)28日のみ
- 櫛田達矢(NBDC)28日のみ
- 山中遼太(先端研)
- 加藤文彦 (ROIS) 27日のみ