ホーム > ソリューション > 論理データモデル

論理データモデル

論理データモデル(以下 LDM : Logical Data Model)は、データウェアハウス内のデータ格納を論理的に記述したものです。建物に喩えるのであれば、設計図、または青写真であり、どのようにデータが格納されるのか、そしてどんなデータが格納されるのかを記述しています。これによって、データウェアハウスの構築に関連するすべての人は、その全体像を把握できると共に、データ間の関係を理解することが可能となります。

汎業態的なLDMのイメージ

LDM の特徴

LDM において、データは 3rd Normal Form(第3正規形)と呼ばれる形式で整理されます。正規形で保持することにより、データの重複を回避し、データ間の整合性と一貫性を保ち、将来的なデータ構造の追加、変更があった際の修正を最小限に抑えることが可能となります。そして正規形で保持されたデータの表現としては ER( Entity - Relation)モデルが採用されています。これはデータの形式を Entity(主体)と Relation(関係)を主とした形で記述するものです。これによってそれぞれのデータ主体とデータ間の関係を鮮やかに描くことが可能になるだけでなく、データウェアハウスに実装するべき物理データベースデザインのベースとすることが可能です。論理データモデルと物理データベースデザインの関係は以下の通りです。

論理データモデルと物理データベースデザインの対応

主題指向 “Load once, Use many times”

LDM構築にあたって忘れてはならない概念が、“主題指向”という考え方です。データウェアハウスの構築においてデータをどのように保持するかという点は、往々にして分析アプリケーション側の目的指向性に基づいて構築されがちです。これはデータウェアハウス上で稼動する分析アプリケーションが 1つしかないうちは問題となりません。しかしながら企業がコンピューター資産、データ資産の最大活用や全体最適を意図し、1つのデータを複数の分析アプリケーションで共有する際には、大きな壁に突き当たることになります。LDM の基本コンセプトは、1つのデータが複数の分析アプリケーションで共有されることを前提に、それぞれのデータを主題(サブジェクト)ごとに保持し、それぞれの分析アプリケーションが持つ目的(オブジェクト)から独立させることにあります。これによってデータはそれぞれの分析アプリケーションの目的に合致したデータを提供しつつ、データとしての独立性を保ち、データの重複や不整合を回避することが可能となります。

ホワイトペーパー「データモデル概要」

主題指向に基づいて構築された LDM を、物理的なデータウェアハウスに実装していく際のポイントをテラデータのコンサルタントがまとめました。正規形モデルとディメンショナルモデルの対比、双方の優位点を生かしつつ実装していく手法、BI/ETLツールや アクティブ・データウェアハウス環境への影響についてご紹介します。

LDM の価値

LDM をベースにデータウェアハウスを構築することにより、以下のようなメリットがあります。

  • 1. 不整合なデータ利用による意思決定のブレを最小化
  • 2. データ保持の重複回避により
    ・コンピューター、およびディスク資源の重複回避
    ・データロードの流れをシンプルに(設計、運用)
  • 3. 分析アプリケーション開発の作業を軽減
    ・データウェアハウス上のデータを利用可能
    ・分析アプリケーションからの投資回収開始の早期化
  • 4. データウェアハウス構築の作業を軽減
    ・論理設計作業の軽減
    ・現状データ、分析要件から導き出されるデータとのギャップ分析
    ・データ拡張/変更時のメンテナンスの容易さ

Teradata Industry LDM

テラデータでは LDM を、各業界向けに用意しています。これらの LDM は、テラデータが長年にわたり各業界のデータウェアハウス構築を支援していく中で蓄積した経験の集大成です。各業界ごとの LDM は、人や時間、場所、会計などといったビジネス活動において共通のサブジェクトエリアと、業界に特有のサブジェクトエリアを組み合わせています。当然ながら企業によって事業ドメインやビジネスモデルは異なるため、各 LDM を雛形として利用し個別要件に応じて修正を加えることで、迅速かつ確実に個別企業ごとの LDM へと発展させることが可能となります。LDM をベースにデータウェアハウスを構築することで、包括的で将来の拡張を見据えたデータウェアハウスのロードマップを構築できるとともに、分散化したシステムにおけるデータの統合時や、企業合併、事業ドメインの拡張/変更に伴うシステムの変更時にも、企業が保持するデータのグランドデザインとして威力を発揮します。

  • 個別要件に基づくデータ項目追加
  • データサブジェクト追加に伴う拡張
  • 複数データマートの統合
  • 企業合併、事業拡張/変更に伴う統合
  • グループ企業、複数業態におけるデータ統合

データ統合ロードマップ

企業は事業上の目標を設定し、その目標に向けて事業を運営します。そして事業運営上さまざまな課題に対処しながら、事業上の成果を目標に近づけていきます。データウェアハウスに蓄積されるデータは、企業内のユーザーが課題に直面した際に把握したい事実です。事実を把握することによって課題に対する理解が深まり、採るべき行動が明確となります。データウェアハウスに対して問い合わせを行い、定量的に理解すべき指標を把握することによって、ユーザーは自身の業務上の行動を正しく意思決定することができます。テラデータのデータ統合ロードマップは、Teradata Industry LDM に対応する形で開発され、以下に示すような要素の関係性を記述しています。

データ統合ロードマップ
  • 目標/戦略:ビジネスの方向性を決める目標、戦略などを規定します。
  • 経営改善課題(BIO: Business Improvement Opportunities):対処し、改善すべき課題を規定します。従属するビジネス上の目標、必要となる分析、分析に伴って採用される行動、行動に伴って得られる効果のポイントを規定しています。
  • ビジネスクエスチョン:課題に対処する際に把握すべき、理解すべき内容の問い合わせを規定します。データウェアハウス活用時に SQLクエリーに翻訳されるべき内容です。
  • 主要業績指標(KPI: Key Performance Indicator): ビジネスクエスチョンに対して回答すべき定量指標を規定します。
  • 論理データモデル:サブジェクトエリア、エリア内のデータ項目(Entity-Relation-Attribute)を規定します。データウェアハウス実装時にテーブルとカラムとして定義されるべき内容です。
  • データソース:論理データモデルに規定されたデータ項目の発生源を規定します。データウェアハウス実装時の ETL元として定義されるべき内容です。

一つの目標を達成するためには、いくつもの課題に対処する必要があり、いくつかの課題に共通するビジネスクエスチョン、いくつかの課題に共通する KPI が存在します。データ統合ロードマップは、このような複数対複数の関係性を紐付けすることにより、ビジネス上の目標や課題から必要になる分析、ビジネスクエスチョン、そしてデータについて整理したものです。論理データモデルをデータウェアハウスという建物の設計図とするならば、データ統合ロードマップは建物のモックアップ(模型)です。ミニチュアのデータウェアハウス模型を全体として俯瞰することが可能となり、課題から演繹的に必要となるデータ、データから帰納的に実施可能となる分析を、紐を手繰るように導き出すことが可能となります。