RDFポータルの統計情報

提供:TogoWiki

移動: 案内, 検索

目次

統計情報

統計情報一覧

Dataset単位

Graph単位

Class単位

Property単位

その他

SPARQL例

Dataset単位

Number of triples
SELECT COUNT(?s) AS ?count
WHERE {
    ?s ?p ?o .
}
List of graphs
SELECT DISTINCT ?g
WHERE {
    GRAPH ?g { ?s ?p ?o . }
}

Graph単位

Number of triples
SELECT COUNT(?s) AS ?count
FROM <#graph>
WHERE {
    ?s ?p ?o .
}
Number of unique classes
SELECT COUNT(DISTINCT ?c) AS ?count
FROM <#graph>
WHERE {
    { ?c rdf:type rdfs:Class . }
    UNION
    { [] rdf:type ?c . }
    UNION
    { [] rdfs:domain ?c . }
    UNION
    { [] rdfs:range ?c . }
    UNION
    { ?c rdfs:subclassOf [] . }
    UNION
    { [] rdfs:subclassOf ?c . }
}
List of unique classes
SELECT DISTINCT ?c
FROM <#graph>
WHERE {
    { ?c rdf:type rdfs:Class . }
    UNION
    { [] rdf:type ?c . }
    UNION
    { [] rdfs:domain ?c . }
    UNION
    { [] rdfs:range ?c . }
    UNION
    { ?c rdfs:subclassOf [] . }
    UNION
    { [] rdfs:subclassOf ?c . }
}
Number of unique instances (entities)
SELECT COUNT(DISTINCT ?i) AS ?count
FROM <#graph>
WHERE {
    ?i rdf:type [] .
}
Number of unique properties
SELECT COUNT(DISTINCT ?p) AS ?count
FROM <#graph>
WHERE{
    [] ?p [] .
}
List of unique properties
SELECT DISTINCT ?p
FROM <#graph>
WHERE {
    [] ?p [] .
}
Number of unique subjects
SELECT COUNT(DISTINCT ?s) AS ?count
FROM <#graph>
WHERE {
    ?s [] [] .
}
Number of unique objects
SELECT COUNT(DISTINCT ?o) AS ?count
FROM <#graph>
WHERE {
    [] [] ?o .
    FILTER(!isLiteral(?o))
}
Number of unique literals
SELECT COUNT(DISTINCT ?o) AS ?count
FROM <#graph>
WHERE {
    [] [] ?o .
    FILTER(isLiteral(?o))
}
Number of unique datatypes
SELECT COUNT(DISTINCT datatype(?o)) AS ?count
FROM <#graph>
WHERE {
    [] [] ?o .
    FILTER(isLiteral(?o))
}
List of unique datatypes
SELECT DISTINCT datatype(?o)
FROM <#graph>
WHERE {
    [] [] ?o .
    FILTER(isLiteral(?o))
}
Number of cross-references to external databases (using Identifies.org)
SELECT COUNT(?o) AS ?count
FROM <#graph>
WHERE {
    [] rdfs:seeAlso ?o .
    FILTER regex(?o, "^http://identifiers.org/")
}

Class単位

Number of unique instances
SELECT COUNT(DISTINCT ?i) AS ?count
FROM <#graph>
WHERE {
    ?i rdf:type <#class> .
}

Property単位

Number of triples
SELECT COUNT(?s) AS ?count
FROM <#graph>
WHERE {
    ?s <#property> ?o .
}
List of domain classes
SELECT DISTINCT ?d
FROM <#graph>
WHERE {
    <#property> rdfs:domain ?d .
}
List of range classes
SELECT DISTINCT ?r
FROM <#graph>
WHERE {
    <#property> rdfs:range ?r .
}

その他

Cross-references between graphs
SELECT DISTINCT ?g1 ?g2 ?i1
WHERE {
    {
        GRAPH ?g1 { [] rdfs:seeAlso ?i1 . FILTER(isIRI(?i1)) }
    }
    {
        GRAPH ?g2 { ?i2 [] [] . }
    }
    FILTER (?g1 != ?g2 && ?i1 = ?i2)
}


参考にしたサイト

スライド 32ページ目
6.6 Statistics

メタデータ

データセットのメタデータ

データセット名称(*必須)
データセットの名称。
URL
データセットを提供しているオリジナルサイトのURL。
プロジェクト名
データセットを作成した研究プロジェクト名。
作成者 (氏名と所属) (*1名以上必須)
主にデータセットの作成に関わった方の氏名と所属。
氏名については、英語は「名 姓」、日本語は「姓 名」の順。
所属は所属機関名の正式名称。
例: 国立研究開発法人科学技術振興機構 バイオサイエンスデータベースセンター
カテゴリー (Type1):対象 (*1つ以上必須)
「Integbioデータベースカタログ」で使われているカテゴリ「対象」から該当するカテゴリを選択。
カテゴリー (Type2):データの種類 (*1つ以上必須)
「Integbioデータベースカタログ」で使われているカテゴリ「データの種類」から該当するカテゴリを選択。
データセットバージョン
データセットのバージョン。
更新日 (*必須)
データセットの最終更新日。
説明 (*必須)
データセットの説明。
ライセンス名称
データセットに適用するライセンス (利用許諾) の名称。
例: クリエイティブ・コモンズ 表示 - 継承 2.1 日本
ライセンスのURL (*必須)
データセットに適用するライセンス (利用許諾)の内容を示すURL。
例: http://creativecommons.org/licenses/by-sa/2.1/jp/
クレジット (*必須)
データセットの再利用時等に、第三者が表示に使うためのクレジット。
例: データベースA (c) 山田 太郎 (B研究所) licensed under CC 表示 - 継承 2.1 日本
オントロジーURI
オントロジーのURI。
オントロジーの説明
オントロジーの説明。
ファイル名 (オントロジー)
オントロジーのファイル名。
グラフURI
グラフのURI。
グラフの説明
グラフの説明。
ファイル名 (グラフ)
グラフを構成するRDFファイル名。

RDF化

メタデータと統計情報のRDF化

RDF化例:

@prefix dcterms: <http://purl.org/dc/terms/>.
@prefix foaf: <http://xmlns.com/foaf/0.1/>.
@prefix xsd: <http://www.w3.org/2001/XMLSchema#>.
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>.
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>.
@prefix schema: <http://schema.org/>.
@prefix sd: <http://www.w3.org/ns/sparql-service-description#>.
@prefix pav: <http://purl.org/pav/>.
@prefix skos: <http://www.w3.org/2004/02/skos/core#>.
@prefix void: <http://rdfs.org/ns/void#>.
@prefix owl: <http://www.w3.org/2002/07/owl#>.
@prefix vann: <http://purl.org/vocab/vann/>.

<http://integbio.jp/rdf/> rdf:type sd:Service;
    sd:endpoint <http://integbio.jp/rdf/sparql>.

<http://integbio.jp/rdf/#dataset> rdf:type sd:Dataset, void:Dataset;
    void:sparqlEndpoint <http://integbio.jp/rdf/sparql>;
    dcterms:title "Dataset 1"@en, "データセット1"@ja;
    foaf:homepage <#url-en>, <#urj-jp>;
    dcterms:description "Description ..."@en, "説明 ... "@ja;
    dcterms:creator [
        foaf:name "Name 1"@en, "名前1"@ja;
        schema:affiliation [
            foaf:name "Affilitation 1"@en, "所属1"@ja
        ]
    ];
    dcterms:creator [
        foaf:name "Name 2"@en, "名前2"@ja;
        schema:affiliation [
            foaf:name "Affiliation 2"@en, "所属2"@ja;
        ]
    ];
    void:triples "###"^^xsd:integer;
    pav:version "1.0.0";
    dcterms:issued "2015-##-##"^^xsd:dateTime;
    schema:logo <#logo-url>;
    schema:image <#shema-image-url>;
    sd:namedGraph [
        sd:name <#graph1>;
        sd:graph [
            rdf:type sd:Graph, void:Dataset;
            # Graphの内容がOntologyである場合、以下の1行を追加。
            # rdf:type owl:Ontology;
            dcterms:description "Description of graph1 ... "@en, "グラフ1の説明 ... "@ja;
            void:dataDump <#file1.rdf.gz>, <#file2.rdf.gz>;
            void:triples "###"^^xsd:integer; 
            void:entities "###"^^xsd:integer;
            void:distinctSubjects "###"^^xsd:integer;
            void:distinctObjects "###"^^xsd:integer;
            void:classPartition [
                void:class rdfs:Literal;
                void:entities "###"^^xsd:integer;
            ];
            void:classPartition [
                void:class rdfs:Class;
                void:entities "###"^^xsd:integer;
            ];
            void:classPartition [
                void:class <#class-1>;
                rdfs:label "Class 1"@en, "Class 1"@ja
                void:entities "###"^^xsd:integer;
            ];
            void:classPartition [
                void:class <#class-2>;
                rdfs:label "Class 2"@en, "Class 2"@ja;
                void:entities "###"^^xsd:integer;
            ];
            void:properties "###"^^xsd:integer;
            void:propertyPartition [
                void:property <#property-1> ;
                void:triples "###"^^xsd:integer;
                rdfs:domain <#class-3>;
                rdfs:range <#class-4>;
            ];
            void:propertyPartition [
                void:property <#property-2> ;
                void:triples "###"^^xsd:integer;
                rdfs:domain <#class-5>;
                rdfs:range <#class-6>;
            ];
            # 外部DB(Identifiers.org)へのリンク
            void:subset [
                rdf:type void:Linkset;
                void:linkPredicate rdfs:seeAlso;
                void:subjectsTarget <#graph1>;
                void:objectsTarget <http://identifiers.org/xxx/>;
                void:triples "###"^^xsd:integer;
            ];
        ];
    ];
    # カテゴリ(対象)
    dcat:theme [
        rdf:type skos:Concept;
        skos:inScheme <http://integbio.jp/dbcatalog/resource/theme#target>;
        skos:prefLabel "Protein"@en;
        skos:prefLabel "蛋白質"@ja;
    ];
    # カテゴリ(データの種類)
    dcat:theme [
        rdf:type skos:Concept;
        skos:inScheme <http://integbio.jp/dbcatalog/resource/theme#infotype>;
        skos:prefLabel "Structure"@en;
        skos:prefLabel "構造"@ja;
    ];
    dcterms:license <http://creativecommons.org/licenses/by-sa/2.1/jp/deed.en>,
        <http://creativecommons.org/licenses/by-sa/2.1/jp/>;
    dcterms:rights "Dataset 1 (c) Name 1 (Affiliation 1) licensed under CC Attribution-ShareAlike 2.1 Japan"@en,
        "データセット1 (c) 名前1 (所属1) licensed under CC 表示 - 継承 2.1 日本"@ja;
    # データセット間のリンク
    void:subset [
        rdf:type void:Linkset;
        void:linkPredicate rdfs:seeAlso;
        void:subjectsTarget <http://integbio.jp/rdf/#dataset>;
        void:objectsTarget <http://integbio.jp/rdf/#dataset2>;
        void:triples "###"^^xsd:integer;
    ];
    # 外部DB(Identifiers.org)へのリンク
    void:subset [
        rdf:type void:Linkset;
        void:linkPredicate rdfs:seeAlso;
        void:subjectsTarget <http://integbio.jp/rdf/#dataset>;
        void:objectsTarget <http://identifiers.org/xxx/>;
        void:triples "###"^^xsd:integer;
    ];
    # サンプルクエリ(SPARQL)
    vann:example [
        schema:query "サンプルクエリ1";
        schema:query "サンプルクエリ2";
    ].

<http://integbio.jp/dbcatalog/resource/theme#target>
    rdf:type skos:ConceptScheme;
    skos:prefLabel "target"@en, "対象"@ja.

<http://integbio.jp/dbcatalog/resource/theme#infotype>
    rdf:type skos:ConceptScheme;
    skos:prefLabel "Information type"@en, "データの種類"@ja.