SPARQLthon17/MeSH FA
提供:TogoWiki
(版間での差分)
(→必要な資源) |
|||
15行: | 15行: | ||
=== 必要な資源 === | === 必要な資源 === | ||
- | * RDF化されたライフサイエンス辞書 | + | * RDF化されたライフサイエンス辞書[http://lsd.dbcls.jp/] |
- | * ライフサイエンス辞書のタームと新着論文レビューを結ぶデータ | + | * ライフサイエンス辞書のタームと新着論文レビューを結ぶデータ[ftp://ftp.dbcls.jp/afara] |
* RDF化されたMeSH[http://bioportal.bioontology.org/ontologies/RH-MESH] | * RDF化されたMeSH[http://bioportal.bioontology.org/ontologies/RH-MESH] | ||
* SPARQLエンドポイントとして使えるトリプルストア(Virtuoso[http://virtuoso.openlinksw.com], Sesame[http://sourceforge.net/projects/sesame/files/Sesame%202/], Stardog[http://stardog.com]など) | * SPARQLエンドポイントとして使えるトリプルストア(Virtuoso[http://virtuoso.openlinksw.com], Sesame[http://sourceforge.net/projects/sesame/files/Sesame%202/], Stardog[http://stardog.com]など) |
2014年8月28日 (木) 15:12時点における最新版
新着論文レビューをMeSH概念を用いて検索
TogoStanza[1]を用いたWebアプリの開発例
概要
新着論文レビュー[2]はトップジャーナルに掲載された日本人を著者とする生命科学分野の論文について、論文の著者自身の執筆による、専門分野の異なる生命科学研究者にむけた日本語によるレビューで、用字・用語が統一されているだけでなく、生命科学専門の編集者の視点から一文一文が吟味されて修正が加えられています。 このため、生命科学分野の良質な日本語コンテンツとして、オントロジーとの紐付けなど機械を用いた処理が比較的しやすいと想定されます。 そこで、今回は既に開発、公開されている、RDF化されたライフサイエンス辞書(LSD)[3]を用いて、新着論文レビューの各記事とLSDに収められている概念を結びつけてみます。 LSDは生命科学分野における用語の日英対訳だけでなく、シソーラスや、MeSH概念ツリー[4]との紐付けも行われています。 従って、一度LSDと新着論文レビューを紐づけられれば、MeSH概念ツリーから新着論文レビューに掲載された記事を検索することが可能になります。 2014年2月時点で既に600本を超える記事が収められていることを踏まえ、様々な視点から検索、閲覧可能とすることで、各読者をそれぞれが興味を持つ記事へ効率良く導けるのではないかと考えています。 結果としてより多くの読者を獲得できると期待します。
必要な資源
- RDF化されたライフサイエンス辞書[5]
- ライフサイエンス辞書のタームと新着論文レビューを結ぶデータ[6]
- RDF化されたMeSH[7]
- SPARQLエンドポイントとして使えるトリプルストア(Virtuoso[8], Sesame[9], Stardog[10]など)
LSDと新着論文レビューを結ぶために、自然言語処理技術を利用します。 今回はJavaで手軽に使えるkuromoji[11]を使います。 そして、得られた品詞列に特定のルールを用いて概念を抽出し、LSDの各概念と一致させます。