SPARQLthon41

提供:TogoWiki

(版間での差分)
移動: 案内, 検索
(SPARQLthon グループ)
(SPARQLthon グループ)
136行: 136行:
* 新着論文レビュー 著者用アンケート (飯田・小野)
* 新着論文レビュー 著者用アンケート (飯田・小野)
** http://bit.ly/FA_LA_survey
** http://bit.ly/FA_LA_survey
 +
 +
* トリプルストアのSPARQL1.1対応調査 [[BH12.12/SPARQL11test]] (山本)
== 参考リンク ==
== 参考リンク ==

2016年2月17日 (水) 05:02時点における版

第41回 SPARQLthon を下記日程で開催したいと思います。

目次

開催概要

  • 開催期間:2016年 2月16日(火) 10:00 〜 17日(水) 18:00
  • 開催場所:理化学研究所 和光地区 統合支援施設 2F 大会議室
  • アクセス:http://www.riken.jp/access/wako-map/ (建物番号 C61)
  • 構内徒歩参考写真 : http://wiki.lifesciencedb.jp/mw/SPARQLthon30/access
    • 構内入り口の守衛所にて、カードキーをお受け取りください。守衛さんのところで名刺を渡すと事務処理が簡単に終わります。
    • 所内の食堂は交通系ICカード(Suica等)でのみ支払可能です。
  • 開催連絡:http://groups.google.com/group/biohackathon-jp メーリングリストにて
  • ネットワーク: 理研ゲスト用無線LANサービス、Eduroam
  • 開催期間中にスパコンの見学等のイベントを行います。

プロジェクト

TPP グループ全体

SPARQLthon グループ

  • KEGG OC RDF(仮) データ更新(守屋)
  • JSTシソーラスオントロジー化試験作業(建石・山本・櫛田)
    • 現状の説明
      • JSTシソーラス「関連語(RT)」リンクの整理がしたい
        •  上位下位関係:IS-AとPART-OF混在
        •  RT:IS-AやPART-OFも含まれている
        • シソーラスには語義は書いていない
      • LIFE-SCIENCEに関係する語について関係を整理し、その後その他の分野に広げる
        • 4万語のうちLIFE-SCIENCE11000語
      • 今年度中は1200語について予備作業→このために法造(大阪大学)を使う
        • JSTシソーラスを法造で読めるように法造をカスタマイズ
        • RTをIS-A, PART-OF, 属性, 機能, その他に分けることにする
        • すでにあるIS-A階層は今年度中は変えない
        • 語を追加したり削除したりもしない
    • 今後の作業の進め方に対する案
      自動化できるか
      シソーラス構築自動化の目的として(1) 語彙はすでにあって、関係性を学習したい(今のRT見直しを自動化する)、(2) 新規語彙に対して、関係性とともに学習したい、の2つがあると思われる。
      (1)の自動化案として、単純には
      1. JSTシソーラスと独立に作られたシソーラスTがあるとする。
      2. Tは上位下位概念にもとづく階層構造になっているとする。
      3. Tの語で、直接の上位下位ペアになっている語A,Bに対しA,BをJST大規模辞書で検索するとJSTシソーラス上の優先語(a,bとする)が見つかる(はず)
      4. a,bのJSTシソーラス上での関係がRTだったらIS-Aに変える(候補として、あとで人が見直す?)
      が考えられる。ただし、問題として
      • Tの階層を手放しで信じていいか(例:MeSH A08の下  →IS-AではなくPart-Ofではないか)
      Nervous System [A08]
      Central Nervous System [A08.186]
      Brain [A08.186.211]
      Blood-Brain Barrier [A08.186.211.035]
      Brain Stem [A08.186.211.132] +
      Gray Matter [A08.186.211.168]
      White Matter [A08.186.211.204]
      Cerebral Ventricles [A08.186.211.276] +
      Limbic System [A08.186.211.464] +
      Prosencephalon [A08.186.211.730] +
      Meninges [A08.186.566] +
      Spinal Cord [A08.186.854] +
      • IS-A(Part-of含めある種の上位下位)以外の関係性がついている大規模シソーラスはあるか
        • WordNet/FrameNet:専門用語が少ない
        • 各分野のオントロジー:分野による。ライフサイエンスは比較的オントロジー化が進んでいる分野なので、オントロジーに頼ったやり方ではオントロジーが整備されていない分野に拡張しづらい?
      • ライセンス?
      などがあり得ます。
      JST外のシソーラス/抽出ツール(見つけたもの)
      1)上位下位関係抽出ツール Version1.0
      Wikipediaから箇条書き(「種類」セクションなど)、定義文の解析、カテゴリ階層を利用してIS-A Hierarchyを抽出するツール(2010-10-01、GPLライセンス)
      2)ALIGNフォーラム(高度言語情報融合フォーラム)が言語資源を持っている
      • (A-4)上位語階層データ
      • (A-9)基本的意味関係の事例ベース
      • (D-2) 意味的関係抽出サービス
       など使えるかも
      1)のWikipedia上位下位関係抽出ツールもALIGNからDL可
      3)日本語化したMeSH
      Life Science DictionaryにMeSHとの対応関係がついている。
      • LSD自身はNon Derliverable (改変不可)(個別にライセンス契約をする可能性はある)
      4)[日本語Wordnet http://compling.hss.ntu.edu.sg/wnja/]
      専門用語が少ない懸念あり
  • DBpedia Docker (加藤)
  • Nikkaji-KNApSAcK 化合物間のID対応問題解決のための検討(時松)
  • IntegbioDBcatalogとカタログ上でDBにつけるタグのRDF化(信定)
    • タグのRDF化(試行)

@prefix skos: <http://www.w3.org/2004/02/skos/core#>.

<http://integbio.jp/dbcatalog/resource/theme#tag>

   a skos:ConceptScheme;
   skos:prefLabel "tag"@en;
   skos:prefLabel "タグ"@jp.

<http://integbio.jp/dbcatalog/resource/tag/0001>

   a skos:Concept;
   skos:prefLabel "Genome/Gene"@en;
   skos:prefLabel "ゲノム/遺伝子"@jp;
   skos:description "DB for genomes or genes"@en;
   skos:description "ゲノムや遺伝子関連のDB"@jp;
   skos:comment "-"@en;
   skos:comment "-"@jp.
  • DDBJ BioSample submission/validaton用OWL拡張(藤澤)
  • SPARQL Builder(山口 小林 戀津)
    • フェデレート検索対応へ向けた内部構造設計について議論
  • SRA/BioProject/BioSample +AOE統合など(坊農、仲里)
  • 統合TVの検索キーワード用固定URL機能 実装 (小野)

参考リンク


参加者

  • 片山俊明 (DBCLS)
  • 川島秀一 (DBCLS)
  • 守屋勇樹 (DBCLS)
  • 小林 紀郎 (理研)
  • 時松敏明 (DBCLS)
  • 坊農秀雅 (DBCLS)
  • 大田達郎 (DBCLS)
  • 山口敦子 (DBCLS)
  • 戀津魁 (理研)
  • 山本泰智 (DBCLS)
  • 千葉啓和(基生研)17日のみ
  • 山田一作(野口研究所)
  • 大石直哉(DOGRUN)
  • 岡別府陽子(MSS)
  • 永野朗夫(PENQE)
  • 坂井美津保(PENQE)16日のみ
  • 加藤文彦 (ROIS)
  • 仲里猛留(DBCLS)
  • 山中遼太(Oracle)16日のみ
  • 信定知江(NBDC)16日のみ 16時半まで
  • 小野浩雅(DBCLS)
  • 藤澤貴智(遺伝研)
  • 桝屋啓志 (理研 BRC)
  • 高月照江 (理研 BRC)
  • 田中聡 (Trans-IT)
  • 櫛田達矢(NBDC)
  • 建石由佳(NBDC)
  • 新町大輔(創価大)
  • 青木信行(創価大)
  • 松原正陽(野口研究所)
  • 森田巧 (保健同人社)ご報告にて 16日PMのみ
  • 森宙史(東工大)17日のみ
  • 飯田啓介(DBCLS)
  • 森井陽子(理研BSI)
個人用ツール