RDFポータルの統計情報
提供:TogoWiki
目次 |
統計情報
統計情報一覧
Dataset単位
Graph単位
- Number of triples
- Number of unique classes
- List of unique classes
- Number of unique instances (entities)
- Number of unique properties
- List of unique properties
- Number of unique subjects
- Number of unique objects
- Number of unique literals
- Number of unique datatypes
- List of unique datatypes
- Cross-references to external databases (using Identifies.org)
Class単位
Property単位
その他
SPARQL例
Dataset単位
Number of triples
SELECT COUNT(?s) AS ?count WHERE { ?s ?p ?o . }
List of graphs
SELECT DISTINCT ?g WHERE { GRAPH ?g { ?s ?p ?o . } }
Graph単位
Number of triples
SELECT COUNT(?s) AS ?count FROM <#graph> WHERE { ?s ?p ?o . }
Number of unique classes
SELECT COUNT(DISTINCT ?c) AS ?count FROM <#graph> WHERE { { ?c rdf:type rdfs:Class . } UNION { [] rdf:type ?c . } UNION { [] rdfs:domain ?c . } UNION { [] rdfs:range ?c . } UNION { ?c rdfs:subclassOf [] . } UNION { [] rdfs:subclassOf ?c . } }
List of unique classes
SELECT DISTINCT ?c FROM <#graph> WHERE { { ?c rdf:type rdfs:Class . } UNION { [] rdf:type ?c . } UNION { [] rdfs:domain ?c . } UNION { [] rdfs:range ?c . } UNION { ?c rdfs:subclassOf [] . } UNION { [] rdfs:subclassOf ?c . } }
Number of unique instances (entities)
SELECT COUNT(DISTINCT ?i) AS ?count FROM <#graph> WHERE { ?i rdf:type [] . }
Number of unique properties
SELECT COUNT(DISTINCT ?p) AS ?count FROM <#graph> WHERE{ [] ?p [] . }
List of unique properties
SELECT DISTINCT ?p FROM <#graph> WHERE { [] ?p [] . }
Number of unique subjects
SELECT COUNT(DISTINCT ?s) AS ?count FROM <#graph> WHERE { ?s [] [] . }
Number of unique objects
SELECT COUNT(DISTINCT ?o) AS ?count FROM <#graph> WHERE { [] [] ?o . FILTER(!isLiteral(?o)) }
Number of unique literals
SELECT COUNT(DISTINCT ?o) AS ?count FROM <#graph> WHERE { [] [] ?o . FILTER(isLiteral(?o)) }
Number of unique datatypes
SELECT COUNT(DISTINCT datatype(?o)) AS ?count FROM <#graph> WHERE { [] [] ?o . FILTER(isLiteral(?o)) }
List of unique datatypes
SELECT DISTINCT datatype(?o) FROM <#graph> WHERE { [] [] ?o . FILTER(isLiteral(?o)) }
Number of cross-references to external databases (using Identifies.org)
SELECT COUNT(?o) AS ?count FROM <#graph> WHERE { [] rdfs:seeAlso ?o . FILTER regex(?o, "^http://identifiers.org/") }
Class単位
Number of unique instances
SELECT COUNT(DISTINCT ?i) AS ?count FROM <#graph> WHERE { ?i rdf:type <#class> . }
Property単位
Number of triples
SELECT COUNT(?s) AS ?count FROM <#graph> WHERE { ?s <#property> ?o . }
List of domain classes
SELECT DISTINCT ?d FROM <#graph> WHERE { <#property> rdfs:domain ?d . }
List of range classes
SELECT DISTINCT ?r FROM <#graph> WHERE { <#property> rdfs:range ?r . }
その他
Cross-references between graphs
SELECT DISTINCT ?g1 ?g2 ?i1 WHERE { { GRAPH ?g1 { [] rdfs:seeAlso ?i1 . FILTER(isIRI(?i1)) } } { GRAPH ?g2 { ?i2 [] [] . } } FILTER (?g1 != ?g2 && ?i1 = ?i2) }
参考にしたサイト
- スライド 32ページ目
- 6.6 Statistics
メタデータ
データセットのメタデータ
- データセット名称(*必須)
- データセットの名称。
- URL
- データセットを提供しているオリジナルサイトのURL。
- プロジェクト名
- データセットを作成した研究プロジェクト名。
- 作成者 (氏名と所属) (*1名以上必須)
- 主にデータセットの作成に関わった方の氏名と所属。
- 氏名については、英語は「名 姓」、日本語は「姓 名」の順。
- 所属は所属機関名の正式名称。
- 例: 国立研究開発法人科学技術振興機構 バイオサイエンスデータベースセンター
- カテゴリー (Type1):対象 (*1つ以上必須)
- 「Integbioデータベースカタログ」で使われているカテゴリ「対象」から該当するカテゴリを選択。
- カテゴリー (Type2):データの種類 (*1つ以上必須)
- 「Integbioデータベースカタログ」で使われているカテゴリ「データの種類」から該当するカテゴリを選択。
- データセットバージョン
- データセットのバージョン。
- 更新日 (*必須)
- データセットの最終更新日。
- 説明 (*必須)
- データセットの説明。
- ライセンス名称
- データセットに適用するライセンス (利用許諾) の名称。
- 例: クリエイティブ・コモンズ 表示 - 継承 2.1 日本
- ライセンスのURL (*必須)
- データセットに適用するライセンス (利用許諾)の内容を示すURL。
- 例: http://creativecommons.org/licenses/by-sa/2.1/jp/
- クレジット (*必須)
- データセットの再利用時等に、第三者が表示に使うためのクレジット。
- 例: データベースA (c) 山田 太郎 (B研究所) licensed under CC 表示 - 継承 2.1 日本
- オントロジーURI
- オントロジーのURI。
- オントロジーの説明
- オントロジーの説明。
- ファイル名 (オントロジー)
- オントロジーのファイル名。
- グラフURI
- グラフのURI。
- グラフの説明
- グラフの説明。
- ファイル名 (グラフ)
- グラフを構成するRDFファイル名。
RDF化
メタデータと統計情報のRDF化
RDF化例:
@prefix dcterms: <http://purl.org/dc/terms/>. @prefix foaf: <http://xmlns.com/foaf/0.1/>. @prefix xsd: <http://www.w3.org/2001/XMLSchema#>. @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>. @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>. @prefix schema: <http://schema.org/>. @prefix sd: <http://www.w3.org/ns/sparql-service-description#>. @prefix pav: <http://purl.org/pav/>. @prefix skos: <http://www.w3.org/2004/02/skos/core#>. @prefix void: <http://rdfs.org/ns/void#>. @prefix owl: <http://www.w3.org/2002/07/owl#>. @prefix vann: <http://purl.org/vocab/vann/>. <http://integbio.jp/rdf/> rdf:type sd:Service; sd:endpoint <http://integbio.jp/rdf/sparql>. <http://integbio.jp/rdf/#dataset> rdf:type sd:Dataset, void:Dataset; void:sparqlEndpoint <http://integbio.jp/rdf/sparql>; dcterms:title "Dataset 1"@en, "データセット1"@ja; foaf:homepage <#url-en>, <#urj-jp>; dcterms:description "Description ..."@en, "説明 ... "@ja; dcterms:creator [ foaf:name "Name 1"@en, "名前1"@ja; schema:affiliation [ foaf:name "Affilitation 1"@en, "所属1"@ja ] ]; dcterms:creator [ foaf:name "Name 2"@en, "名前2"@ja; schema:affiliation [ foaf:name "Affiliation 2"@en, "所属2"@ja; ] ]; void:triples "###"^^xsd:integer; pav:version "1.0.0"; dcterms:issued "2015-##-##"^^xsd:dateTime; schema:logo <#logo-url>; schema:image <#shema-image-url>; sd:namedGraph [ sd:name <#graph1>; sd:graph [ rdf:type sd:Graph, void:Dataset; # Graphの内容がOntologyである場合、以下の1行を追加。 # rdf:type owl:Ontology; dcterms:description "Description of graph1 ... "@en, "グラフ1の説明 ... "@ja; void:dataDump <#file1.rdf.gz>, <#file2.rdf.gz>; void:triples "###"^^xsd:integer; void:entities "###"^^xsd:integer; void:distinctSubjects "###"^^xsd:integer; void:distinctObjects "###"^^xsd:integer; void:classPartition [ void:class rdfs:Literal; void:entities "###"^^xsd:integer; ]; void:classPartition [ void:class rdfs:Class; void:entities "###"^^xsd:integer; ]; void:classPartition [ void:class <#class-1>; rdfs:label "Class 1"@en, "Class 1"@ja void:entities "###"^^xsd:integer; ]; void:classPartition [ void:class <#class-2>; rdfs:label "Class 2"@en, "Class 2"@ja; void:entities "###"^^xsd:integer; ]; void:properties "###"^^xsd:integer; void:propertyPartition [ void:property <#property-1> ; void:triples "###"^^xsd:integer; rdfs:domain <#class-3>; rdfs:range <#class-4>; ]; void:propertyPartition [ void:property <#property-2> ; void:triples "###"^^xsd:integer; rdfs:domain <#class-5>; rdfs:range <#class-6>; ]; # 外部DB(Identifiers.org)へのリンク void:subset [ rdf:type void:Linkset; void:linkPredicate rdfs:seeAlso; void:subjectsTarget <#graph1>; void:objectsTarget <http://identifiers.org/xxx/>; void:triples "###"^^xsd:integer; ]; ]; ]; # カテゴリ(対象) dcat:theme [ rdf:type skos:Concept; skos:inScheme <http://integbio.jp/dbcatalog/resource/theme#target>; skos:prefLabel "Protein"@en; skos:prefLabel "蛋白質"@ja; ]; # カテゴリ(データの種類) dcat:theme [ rdf:type skos:Concept; skos:inScheme <http://integbio.jp/dbcatalog/resource/theme#infotype>; skos:prefLabel "Structure"@en; skos:prefLabel "構造"@ja; ]; dcterms:license <http://creativecommons.org/licenses/by-sa/2.1/jp/deed.en>, <http://creativecommons.org/licenses/by-sa/2.1/jp/>; dcterms:rights "Dataset 1 (c) Name 1 (Affiliation 1) licensed under CC Attribution-ShareAlike 2.1 Japan"@en, "データセット1 (c) 名前1 (所属1) licensed under CC 表示 - 継承 2.1 日本"@ja; # データセット間のリンク void:subset [ rdf:type void:Linkset; void:linkPredicate rdfs:seeAlso; void:subjectsTarget <http://integbio.jp/rdf/#dataset>; void:objectsTarget <http://integbio.jp/rdf/#dataset2>; void:triples "###"^^xsd:integer; ]; # 外部DB(Identifiers.org)へのリンク void:subset [ rdf:type void:Linkset; void:linkPredicate rdfs:seeAlso; void:subjectsTarget <http://integbio.jp/rdf/#dataset>; void:objectsTarget <http://identifiers.org/xxx/>; void:triples "###"^^xsd:integer; ]; # サンプルクエリ(SPARQL) vann:example [ schema:query "サンプルクエリ1"; schema:query "サンプルクエリ2"; ]. <http://integbio.jp/dbcatalog/resource/theme#target> rdf:type skos:ConceptScheme; skos:prefLabel "target"@en, "対象"@ja. <http://integbio.jp/dbcatalog/resource/theme#infotype> rdf:type skos:ConceptScheme; skos:prefLabel "Information type"@en, "データの種類"@ja.