ホーム > プロダクト&サービス > Teradata Unified Data Architecture™

Teradata Unified Data Architecture™

分析を必要とするすべての利用者に、あらゆるデータの活用環境を提供

Teradata Unified Data Architecture(Teradata UDA)は、多様化するデータ構造を包括的に管理し、分析に活用していくためのアーキテクチャです。異なるデータ構造と処理に対応した 3つの並列処理プラットフォームを有機的に結合し、データの形式を問わず分析できる環境を提供します。

Teradata Unified Data Architecture

 

並列処理プラットフォーム

Teradata: リレーショナル・データベース形式に構造化されたデータを蓄積、分析するための統合データウェアハウス・プラットフォーム

Teradataデータベースは、大規模データウェアハウスのプラットフォームとして、さまざまな業界の企業で活用されている、リレーショナル・データベース管理のソフトウェアです。独自のデータ配置アルゴリズム、並列処理アーキテクチャにより、数千台のサーバーノード、数十ペタバイト級のデータを単一システムとして拡張でき、かつボトルネックが発生することなくスケールアウトするという特徴を有しています。また、ジョイン処理や同時並行ユーザーサポートに優れていることから、構造化データを統合的に管理し、全社規模で、共通の事実に基づいた意思決定を行うための基盤として利用することが可能です。

Teradataデータベース

Teradata Aster:ログデータなどの異なる構造を有するデータに対して、SQL-MapReduce(R)技術を用いた探索的分析を行うプラットフォーム

Teradata Aster は、リレーショナル・データベース管理のソフトウェアでありながら、SQL の関数として MapReduce を利用できる、多構造化データに対する探索的分析プラットフォームです。構造化されていないデータの中には、例えばアクセスログやマシンログのように、一定のルールに基づいて格納されているデータがあります。これらのデータはそれぞれに異なる構造を非明示的に有しています。Teradata Aster はこのようなデータをリレーショナル・データベース内に格納し、SQL-MapReduce関数を用いた各種の処理や、対話的、反復的な分析を行うことが可能です。MapReduce処理として頻用される約70の処理を関数として事前に準備しているため、分析ユーザーは SQL内に関数として指定するだけで活用できます。また Java などで開発された独自の MapReduce処理を関数として追加、利用することも可能となっています。

Teradata Aster

オープンソースHadoop:構造化されていないデータを格納、処理するためのプラットフォーム

元々は、インターネット上に存在する膨大な Webページを分解し、検索サービスに活用可能な形へと変換するために開発された Hadoop。構造化されていない大規模なデータを分散格納し、並列処理を行うのに優れている反面、Java などのプログラミング言語を利用する必要があり、また対話的で反復的な分析処理には不向きです。そのためテラデータでは、Hadoop を構造化されていないデータを格納し、変換や加工などのバッチ処理を行うプラットフォームとして位置づけています。テラデータは、Apache Hadoop のディストリビューションを行っており、また Hadoop に関する多くの開発コードを Apache Software Foundation にフィードバックしている、Hortonworks社と提携しました。
また、Hortonworks社から提供されるディストリビューション(HDP:Hortonworks Data Platform)を、Teradata Aster と同居可能なハードウェア・プラットフォーム上に搭載し、アプライアンスとして提供します。これにより、大規模かつ構造化されていないデータを安価に格納し、必要に応じて分析に活用することを可能にすると共に、Teradata および Teradata Aster のデータ管理基盤と併せて包括的に管理することが可能です。

Hortonworks社との提携プレスリリース

Hortonworks社 Webサイト

 

各プラットフォームの統合と連携

これら 3つのプラットフォームそれぞれに得意な処理をさせるためには、自在にプラットフォーム間をデータ移動できることが必要です。また、分析ユーザーの観点から見た場合、それぞれ異なる構造を持つデータに対して透過的にアクセスできることが求められます。そして当然ながら、これらのプラットフォームを一元管理できなければ、情報システムの管理運用コストは肥大化することになります。Teradata UDA は 3つのプラットフォームを提供するだけでなく、各プラットフォームに格納されたデータへのアクセス、移動、そして管理に関する次の機能を提供します。

アクセス

  • Teradata SQL Assistant を利用した Teradata および Teradata Aster への問い合わせ
  • SQL-H による、Teradata および Teradata Aster を介した Hadoop分散ファイルシステムへの問い合わせ
  • Unity Director による、複数の Teradataシステムへの問い合わせルーティング

Teradata SQL Assistant

Teradata SQL-H 概要(PDF)

Aster SQL-H 概要

Unity Director

移動

  • Aster-Hadoop Adapter を利用した、Hadoop-Aster間のデータ移動
  • Aster-Teradata Adapter を利用した、Aster-Teradata間のデータ移動
  • Teradata Connector for Hadoop を利用した、Teradata-Hadoop間のデータ移動
  • Unity Data Mover による、複数の Teradataシステム間でのデータ移動

Teradata Aster の接続性

Unity Data Mover

管理

  • Teradata Viewpoint を利用した各データベース/データストアの統合管理
  • テラデータのリモート・サポート・サービスへの障害検知通知とログ取得
  • Unity Ecosystem Manager による、複数の Teradataシステムへの稼働状況監視
  • Unity Director による、複数の Teradataシステム間でのデータベース同期

Teradata Viewpoint

Unity Ecosystem Manager

Unity Director

 

Teradata UDA の特徴

Teradata UDA は、以下の特徴を有します。これらはいずれも、未曾有のボリュームとなるデータが発生し、なおかつそれぞれのデータが異なる構造を有し、一方でプログラミングを行うエンジニアから、統計解析などに精通した分析の専門担当者、トップマネジメント、現場のビジネスユーザーといった、異なるスキルと役割を持ったそれぞれのユーザーが、データ分析を行っていく際に不可欠な要件です。

拡張性

Teradata UDA が提供するプラットフォームは、いずれもデータ構造を問わずスケールアウトできる並列処理のプラットフォームです。Teradata、Teradata Aster、Hadoop共に、並列処理のアーキテクチャを採用しており、データボリュームや処理の増加に対応する形でコンピューターを追加拡張し、一定のパフォーマンスを確保できるアーキテクチャになっています。

シンプルかつ強力な分析環境

SQL(Structured Query Language)はデータ管理と操作のための、簡便で優れた言語です。プログラミング言語よりも簡単で、業界全般に採用されており、ビジネスインテリジェンス・ソフトウェアなどが動作する場合にも、背後でリレーショナル・データベースと連携する役割を有しています。一方で SQL がアクセスするデータの対象は、リレーショナル・データベースに限定されており、多構造化データ全般には向かないとされてきました。Teradata Aster が提供する SQL-MapReduce により、分析ユーザーは SQL とほぼ同等の知識で、登録済みの MapReduceプログラムを実行し、多構造化データに対して反復的な分析を行うことが可能となります。また SQL-H を介して、Hadoop分散ファイルシステム内のデータに対しても直接分析を行うことが可能です。Teradata UDA は、長年にわたりデータ分析の基幹技術である SQL を、そのまま多構造化データに適用できる環境を提供します。

得られる洞察

多構造化データの多くは、アクセスログ、センサーデータなど、単一の主題(サブジェクト)に基づいて蓄積されており、これらに対して分析を適用することによって洞察を得ることができます。一方でこのようなデータの多くは、他のデータと共通のデータ対象(オブジェクト)を有しています。例えば顧客や商品のようなデータ対象を分析する場合、データ対象を基準に複数のデータサブジェクトを重ね合わることによって、包括的で多角的な視点を得ることが可能となります。Hadoop上でバッチ処理を行い加工されたデータ、Aster上で構造化されたデータを Teradata上で統合し、このデータに対して分析を行うことによって、単一のサブジェクトだけで得られる洞察以上の価値を見出すことが可能になります。

 

導入のメリット

企業が従来からの構造化データにプラスして、多構造化データを収集し分析するとき、単なるデータ構造の違いだけでなく、これまでとは異なるデータボリューム、そしてプログラミングを中心とした ITスキルにも制約を感じることになるでしょう。Teradata UDA を採用することの利点は、このような制約から解放され、データから導き出される知識の獲得量と獲得スピードを拡大できる点にあります。 また、コスト対効果で考えた場合にも、このアーキテクチャの利点は明確です。既存のプラットフォームに無理やり異なる構造のデータを保持し、そこで処理を行えば、必要以上の手間とコストがかかります。一方で既存の構造化データ含めて新しい技術に移行すれば、これもまた大きな投資を必要とします。既存の資産を有効に活用しつつ、新たな技術を自社のデータ分析環境に適用し、データ構造と処理特性に応じてもっとも適したプラットフォームを採用できるなら、これは最も合理的な投資です。そしてこれに加え、統合的な分析環境として管理していくことは、それぞれのプラットフォームを単独で採用していく際に起こりうる管理の煩雑さも回避します。Teradata UDA は、多構造化データに挑戦する企業にとって、最も制約が少ない、そして最もコスト対効果の高いアーキテクチャです。

 

関連リンク

Teradata Unified Data Architecture ですべてのデータを有効活用(PDF)

Teradata Unified Data Architecture がデータを利益に変える(PDF)