社会・産業のデジタル変革

データ利活用のための基礎知識

公開日:2024年3月29日

最終更新日:2024年8月21日

独立行政法人情報処理推進機構
デジタル基盤センター

基礎知識資料公開の背景 

データ交換する際によく問題となるのが、「そのデータの中の情報が持つ意味」をお互いに共通理解できているかどうかです。例えば、ひとこと“水”と言っても、“生活用水”なのか“飲料水”なのかがはっきりしないようだと災害対策現場では混乱してしまいます。
そのため、同じ用語でも違う意味として使われていたり、逆に、違う用語でも同じ意味として使われていたりと、「その時の状況」や「そのひとの持つ背景」により用語の認識に違いが発生することがあります。
このような認識の違いが生じないようにするため、用語の定義が必要となります。
複数の関係者間でのデータ交換においては、標準ルール等により決められた方法で整理することが望ましく、さらに、国や分野の壁を越えた相互運用を考えたとき、国際的な合意のもと定められた標準ルールに沿って整理することが望まれます。
ただし、この用語の定義においては、様々な専門的な用語や概念、技術やルール等が存在することにより、データの整理方法を検討する際、人によりそれらの解釈が異なる事が往々にして発生します。またAI分野においても、正しく整備された学習データをもとに処理をおこなわないと正しい結果が得られません。
そのため、まずは用語を定義する上において、基本となる専門的な用語や技術、ルールについての共通認識を得る必要があり、そのような場面で検討に参加される可能性がある人がこれら資料の対象となります。

データ辞書がなぜ必要か

本書では、データの意味を判別する仕組みの一つであるデータ辞書について、その必要性や考え方についてできるだけわかりやすく説明することを目指しています。これからデータの利活用を経営に取り入れたい方やデータ整備の企画を推進する方などにも、より一層理解を深めていただけるようまとめています。

データが持つ意味を表現する技術要素について

本資料は、用語の定義に関する全ての情報を網羅したものではありませんが、IPA内で基本的な共通認識を図るため、勉強会を開催した際の資料です。

勉強会で対象とした用語、技術、ルールの全体像イメージ

セマンティック分野において使われている用語や概念、技術やルールは人によって解釈が異なるため、位置付けの整理に正解はありません。しかし、勉強会に参加したメンバー間で共通認識を図るため、今回の勉強会では、それぞれの位置付けを以下のように設定し勉強を進めています。

  • 勉強会で対象とした用語、技術、ルールの全体像イメージ図

勉強会資料

Ontology表紙イメージ

1.Ontology(オントロジー)

  1. オントロジーとは
  2. IDSのオントロジー構成
  3. オントロジー辞書
OWL表紙イメージ

2.OWL

  1. OWLとは
  2. OWLオントロジーをRDFグラフで表示
  3. OWL(Webオントロジー言語)の構造仕様
  4. OWL(Webオントロジー言語)の構造
RDFs表紙イメージ

3.RDFs

  1. RDFsとは
  2. RDFスキーマのクラスとプロパティ
SKOS 表紙イメージ

4.SKOS (スコース)

  1. SKOS (スコース)とは
  2. SKOS (スコース)に類似する体系
  3. SKOSを使った事例:農作物語彙体系(Crop Vocabulary)
タクソノミー表紙イメージ

5.Taxonomy(タクソノミー)

  1. タクソノミーとは
  2. 財務ドメインのデジタル語彙基盤
  3. 各国の語彙及び関連情報の定義
コーパス表紙イメージ

6.Corpus (コーパス)

  1. Corpus(コーパス)とは
  2. 例えば、 Corpusの考えを基に、文章を品詞分類で分類してみる
CDD表紙イメージ

7.IEC 61360 Common Data Dictionary(CDD)

  1. IEC 61360 Common Data Dictionary(CDD)とは
  2. IEC 61360 Common Data Dictionary(CDD)について
  3. IEC62656のJIS規格
  4. IEC61360の規格
  5. IEC 61360(PLIB)とIEC62656(POM)について
  6. Parcels sample
  7. IoTとインダストリー4.0に関する標準化動向
  8. 将来のIEC CDDの配備展開(検討案)
  9. JEITAにおけるCDD
ISO/IEC 11179-4表紙イメージ

8.ISO/IEC 11179-4(Information technology - Metadata registries : MDR) の解説

  1. ISO/IEC 11179について
  2. Part 4: Formulation of data definitions について
  3. 前提
  4. データ定義の要件
  5. データ定義の推奨事項

この文書のご利用にあたって

本資料の内容を適用した結果生じたこと、また、適用できなかった結果については、IPA は一切の責任を負いかねますのでご了承ください。

DOI(Digital Object Identifier)

DOIとは、コンテンツの電子データに付与される国際的な識別子です。DOIの前に「https://doi.org/」を付けることで、URLとして機能し、コンテンツのあるURLにリダイレクトされ、リンク切れを防ぐことができます。
本ページのDOIは次のとおりです。

更新履歴

  • 2024年8月21日

    ダウンロードファイル内にDOI情報を記載しました。

  • 2024年7月12日

    DOIの説明文を修正しました。

  • 2024年6月20日

    DOI情報を追加しました。

  • 2024年3月29日

    公開