SPARQLthon25

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
(SPARQLthon グループ)
(SPARQLthon グループ)
60行: 60行:
*** ファイルで管理する方法からトリプルストアで管理するように(VIrtuoso7)
*** ファイルで管理する方法からトリプルストアで管理するように(VIrtuoso7)
-
* DDBJ オントロジー(藤沢)
+
* [[SPARQLthon25/DDBJ|DDBJ オントロジー]](藤沢)
** 最新版のオントロジーで DDBJ/RDF データの構築
** 最新版のオントロジーで DDBJ/RDF データの構築
*** ロード時に十分メモリ (800GB) を確保しないと、ある量を超えるとインポートが止まる。
*** ロード時に十分メモリ (800GB) を確保しないと、ある量を超えるとインポートが止まる。

2014年10月28日 (火) 09:25時点における版

第25回 SPARQLthon を下記日程で開催したいと思います。

目次

開催概要

プロジェクト

TPP グループ全体

java.security.AccessControlException: access denied ("java.net.SocketPermission" "massbank.ufz.de:80" "connect,resolve")

当初はJavaのセキュリティーポリシーの変更かと思ってウェブサイト等もよく読んだのですが、Java7 から 8 での変更点は殆んどありません。

参考 Java7におけるセキュリティーポリシーの変更

検討の結果、見出した原因は「署名されたAppletからアクセスされるサーバー名は、ブラウザ上のサーバー名と同一でないと駄目」 というものでした。Java7までは例えばVirtualHost設定で同一サーバーが許す別の名前でアクセスしても大丈夫だったのですが(具体的には www.massbank.jp のかわりに massbank.jp )、Java8からはサーバー名のwwwまで同じでないと駄目になっています。そのためアドレス名のredirect設定をおこなって解決出来ました。アドレス名で www がなくても良いようにしているサイトや別名を持っているサイトは多いはずなので、多くの人がこの問題に接していると思います。これからドイツ側のサーバーにも設定変更を依頼します。(有田)

対処法: 以下のコードを VirtualHost設定内側の先頭に置く。

RewriteEngine On
RewriteCond %{HTTP_HOST} ^massbank\.jp$ [NC]
RewriteRule (.*) http://www.massbank.jp$1 [R=301,L]

SPARQLthon グループ

  • ICD-10のRDF(ttl形式)の修正とUMLS CUI のマッピング(伊藤)
    • ICD-10: BioPortal で ICD-10 の RDF が研究目的には利用可能
      • もともと WHO の ICD-10 は XML/text だが再配布できないライセンス
    • UMLS (Unified Medical Language System): アメリカ医学図書館の医学体系(用語マッピング)
      • Bio2RDF の SIDER(副作用のDB)のデータと ICD-10 のマッピングをしたい
      • 最終的には医薬基盤研の RDF 化したデータと連携したい
  • SPARQL Builder(小林)
    • ISWC の結果を踏まえて実用性向上のための実装(具体的なデータを用いた評価をする)
    • GUI の改良とそれに向けたサーブレットの改良(魁,山口)
      • クラスリストを「URI 」のリストから「クラスラベル+インスタンス数」のリストに変更
    • メタデータ管理方法の検討(小林,山本,呉)
      • ファイルで管理する方法からトリプルストアで管理するように(VIrtuoso7)
  • DDBJ オントロジー(藤沢)
    • 最新版のオントロジーで DDBJ/RDF データの構築
      • ロード時に十分メモリ (800GB) を確保しないと、ある量を超えるとインポートが止まる。
    • BioInterchange との連携(BH14で?)
    • スキーマ図 TPP-Ontology (片山)
  • 可視化(大田)
    • 目標: SPARQLエンドポイントに入っているRDFモデル図を自動生成する
    • 先に可視化モジュールを作って、メタデータのインポート部分をあとでごにょっとする
      • 案「REST APIを叩き続ければ可視化ができる」的フレームワークを作ればいいのでは?
        • こんなものがあった => http://yuml.me/diagram/class/samples
        • EBI BioSampleのRDFモデルの一部をこれで可視化してみた =>http://tinyurl.com/k9h6ftq
          • こんな風に書きます: [biosd:sample/SAME001;rdfs:label Sample 1{bg:lightskyblue}]-biosd-terms:has-biological-characteristic>[biosd:exp-prop-val/sub1#6c71;rdfs:label Mus Musculus{bg:lightskyblue}],[biosd:exp-prop-val/sub1#6c71;rdfs:label Mus Musculus{bg:lightskyblue}]-biosd-terms:has-biological-charactersitic-type>[biosd:exp-prop-type/sub1#6c71:1;rdfs:label Mus Musculus{bg:lightskyblue}],[biosd:exp-prop-val/sub1#6c71;rdfs:label Mus Musculus{bg:lightskyblue}]-biosd-terms:has-biological-characteristic-type>[biosd:exp-prop-type/sub1#6c71;rdfs:label Organism{bg:lightskyblue}],[biosd:exp-prop-val/sub1#6c71;rdfs:label Mus Musculus{bg:lightskyblue}]-^[efo:experimental factor{bg:cyan}],[biosd:exp-prop-type/sub1#6c71:1;rdfs:label Mus Musculus{bg:lightskyblue}]-^[efo:experimental factor{bg:cyan}],[biosd:exp-prop-type/sub1#6c71;rdfs:label Organism{bg:lightskyblue}]-^[efo:experimental factor{bg:cyan}],[biosd:exp-prop-type/sub1#6c71:1;rdfs:label Mus Musculus{bg:lightskyblue}]-^[ncbi:NCBITaxon_10090;rdfslabel Mus Musculus{bg:cyan}],[inferred by ZOOMA{bg:orange}]-.->[biosd:exp-prop-type/sub1#6c71:1;rdfs:label Mus Musculus{bg:lightskyblue}],[As per original label{bg:orange}]-.->[biosd:exp-prop-type/sub1#6c71;rdfs:label Organism{bg:lightskyblue}]
          • しんどい
      • 煩雑な新しいコーディングルールを作るよりもD3jsを書いてもらう方がむしろ楽なのでは?
      • D3jsはパーツが小さすぎるのでレゴブロック的に組み合わせて可視化ができる、的ラッパーを目指すのがよさそう。
    • 目的/用途と目指す方向をもうちょっと議論する必要あり。
    • プロトタイプ作成の前に可視化ルールについて調査/議論する必要がある
  • 化合物
    • DOI や PMID がつかない文献の RDF 化をどう進めるか検討(時松)
      • SPARQLthon23の櫛田さんの検討をの続きで、KNApSAcK文献のDOIがつかないものがどの程度あるか検討。
        • 延べ引用文献13万弱(重複除去して2万前後か?)から、雑誌の種類をできるだけ平準化して2000強を抽出して、DOI付与の可否を検討。
        • 700程度見た段階で、DOI付与率は25%弱。
        • DOIが付与されない雑誌リストができるので、今後の対応については櫛田さんなどと検討することに。
        • 書籍については別途リスト化して、今後検討
    • 単糖?天然物/単糖(山田)
  • SPARQL 本
    • 粛々と書く(加藤・岡別府・川島・山本・片山)

TODO

  • 2015/1- 以降の日程調整
  • BH14.14 とオープンバイオの日程・場所調整

参考リンク

参加者

  • 片山俊明(DBCLS)
  • 川島秀一(DBCLS)
  • 小林紀郎 (理研)
  • 山本泰智(DBCLS)
  • 守屋勇樹 (DBCLS)
  • 市原寿子 (かずさ)
  • 岡別府陽子(MSS)
  • 伊藤真和吏(NIBIO)
  • 大田達郎(DBCLS)
  • 藤澤貴智(遺伝研)
  • 山口敦子 (DBCLS)
  • 永野朗夫 (PENQE) 27日のみ
  • 有田正規 (遺伝研) 27日のみ
  • 諏訪和大 (リオレクト) 27日のみ
  • 高月照江 (理研BRC)
  • 桝屋啓志 (理研BRC)27日のみ
  • 山本希(東工大)
  • 千葉啓和(基生研)27日のみ
  • 時松敏明 (DBCLS)
  • 戀津魁 (理研)
  • 山田一作(野口研)28日のみ
  • 櫛田達矢(NBDC)28日のみ
  • 山中遼太(先端研)
個人用ツール