ホーム >プロダクト&サービス > アプリケーション > Teradata Warehouse Miner

Teradata Warehouse Miner

Teradataデータベース内部ですべての処理を行うデータマイニング・ソフトウェア

膨大なデータから隠れたパターンを発見し、事象の発生確率予測や、分類を導き出すデータマイニング。Teradata Warehouse Miner は、データのプロファイリングから、データの事前準備、そして分析モデルの構築、スコアリングに至るデータマイニングの全プロセスを、Teradataデータベース内部(In-Database)で行うソフトウェアです。すべての処理を Teradataデータベース内部で行うことにより、効率的なデータマイニングを実現します。

モジュールと機能の概要

Teradata Warehouse Miner は大きく 4つのモジュールで構成されています。いずれも Teradataデータベース内部で処理を行い、インプットとアウトプットのデータは Teradataデータベース内のテーブルを前提としており、処理はすべて SQL で処理されます。利用するユーザーは GUI から実施する分析、インプットするデータ、各種パラメーターを設定した上で実行すると、Teradata内部で処理が行われます。実行結果は、アウトプットテーブルとして Teradataデータベースに格納されるだけでなく、実行時の SQL表示、分析手法に応じたグラフおよびグリッドが表示されます。

図:Teradata Warehouse Miner のモジュール、機能、ユーザー
  • Teradata Profiler
  • 基礎統計などデータベース内の各データをプロファイリングし、品質調査を行う機能です。データマイニングの分析担当者だけでなく、データウェアハウスのデータベース管理者やデータ品質管理担当者が、品質監査の用途で利用可能です。
  • Teradata ADS Generator
  • データマイニング分析に用いるADS(Analytical Data Set:分析データセット)の構築、および ADS を構成する変数を作成する機能です。ADS はすべてテーブルで用意されるため、データマイニングの分析担当者がユーザー間で変数候補を共有可能です。またデータベース管理者は、各種多次元分析、レポーティング、データマイニング・ソフトウェア向けのセマンティック層を作成する際にも利用可能です。外部のデータマイニング・ソフトウェアで構築された PMML(Predictive Model Mark-up Language)形式のモデルをインポートして、Teradataデータベース内部で実行することも可能です。
  • Teradata Warehouse Miner
  • 各種の分析アルゴリズムを用いたモデリング/スコアリング機能、並びに統計的検定機能を提供します。分析担当者は、データベース内部で分析アルゴリズムを利用したモデリングからスコア計算、そしてそのデータの活用までを、すべて Teradataデータベースを利用して実行することが可能です。
  • Teradata Model Manager
  • 作成した SQLモデル、および ADS作成処理(SQL)を登録し、スケジュール設定して定期的に実行する機能です。分析担当者が作成したモデルをビジネスユーザーが実行することも可能となっています。

関連コラム「Teradata Warehouse Miner を利用したデータマイニング」

In-Database処理

Teradata Warehouse Miner の大きな特徴は、データのプロファイリングから ADS の構築、そしてモデリング/スコアリングに至るすべてを、Teradataデータベースの内部で SQL を用いて処理する点です。これにより、以下のような効果を得ることが可能です。

  • データ移動が不要
  • データプロファイリング、データ準備、モデリング、スコアリングの全プロセスにおいてデータの移動やダウンロードが不要です。これによりデータの一元性を維持し、冗長性を排除することが可能となり、コンピューター資源の有効活用とデータの一貫性を維持することが可能となります。
  • Teradataデータベースのパフォーマンスと拡張性を活用
  • 並列処理に優れ、大規模に拡張できる Teradataデータベースのコンピューター資源を、SQL を利用して最大限に活用することが可能です。
  • 分析生産性
  • データ移動が不要で、Teradataデータベースのパフォーマンスを最大限に利用できることから、変数候補の吟味(プロファイリング)、ADS の構築、そして分析における時間的な生産性が大幅に改善します。
  • Teradataデータベースのデータを活用
  • Teradataデータベース内に存在する、データウェアハウス上に一元管理されたデータはすべて利用可能であるため、より広範な変数の利用と、サンプルではない全量データを対象としたデータマイニングが可能となります。
  • モデル精度の改善
  • 分析生産性によって、モデリングにおける反復的なトライアンドエラーのサイクルを短縮することが可能となり、これに加えて Teradataデータウェアハウスの広範な全量データを活用することにより、モデルの精度を改善することが可能です。
  • SQL とデータベーステーブル
  • スコアリングは SQL で記述され、スコアリング結果はデータベーステーブルにて蓄積されます。これにより、他のアプリケーションとの統合、連携が容易となります。データの活用を行うまでのコストと手間を大幅に削減できます。

全社利用型の大規模分析データセット

Teradata Warehouse Miner の ADS構築機能により、企業はユーザーがそれぞれに ADS を構築するのではなく、企業全体で共通の、大規模な ADS を構築することが可能です。それぞれのユーザーはデータマイニングに利用する変数をそれぞれ独自に作成し、データウェアハウス上のデータから作成しますが、その多くが重複していることがあります。これは、変数を作成するに際しても、作成された変数を更新していくにしても、企業全体では大きな無駄が発生していることになります。また、あるユーザーが開発した変数のアイデアが他のユーザーに共有されるには、ユーザーの自発的な共有が必要です。

全社利用型の ADS を構築し、常に最新状態に維持していくことによって、データマイニングユーザーは、ADS作成の手間から解放され、モデリングに集中することが可能となります。また構築された ADS を変数カタログとして利用することにより、ユーザーは自分には思いつかなかった変数を候補として利用することが可能となります。もちろん定期的に変数を追加し、ADS そのものを拡張していくことも可能です。

データマイニング・サービス

テラデータでは、Teradata Warehouse Miner を効果的に活用いただけるよう、顧客企業にデータマイニングを活用いただくためのコンサルティング・サービス、分析代行サービスを提供しています。データマイニング分析のスタートや試行段階において、自社のデータを用い、実業務に即した形で習熟や運用を開始したい場合にご利用ください。

データマイニング・コンサルティング・サービス

データマイニングを利用したマーケティング分析サービス

関連リンク

Teradata Warehouse Miner 製品カタログをダウンロードする(PDF)