データマートの定義
データマートという用語が良く使われています。
定義としては、データウェアハウスのサブセットであり、概ね分析に適したデータベースをそのように呼んでいるようです。
今のところ、一体誰が提唱した言葉なのかは分かりません。
その結果、定義も明確ではなく個人の解釈で異なります。
結構色々なサイトを見ましたが、見つかりませんでした。
海外の学術誌でこの言葉はほとんど見ませんので、日本独自のなんらかの商業団体系の方が付けたのがきっかけで、それが広まったのではないかと邪推しています。
ご存じの方がいれば、コメントで教えていただければ助かります。
データマートは「分析用のデータベース」として利用されていますが、その多くがアドホッククエリではなく何らかのソフトウェアからのアクセスを想定しています。
ソフトウェアとしては、BIツールが代表的です。
また、データマートと非常に関連が深い概念が、ディメンショナル・データモデリング(Dimensional Data Modeling)です。
ディメンショナル・データモデリングは、ラルフ・キンボール博士によって考案されました。
発表時期は、インモン博士によってデータウェアハウスが発表された時期に近いです。
データ集計等の特定クエリの高速化に適した設計として知られており、昨今のBIツールの基盤として用いられています。
詳細については、別ページで解説したいと思います。
データモデルとは?
データモデルという言葉を聞いてどのようにとらえますか?
モデルというのは、「数式」という意味もあります。
1990年代までは、先ほど例に挙げたディメンショナル・データモデルも含めて、テーブル構成と数式のセットで提案されていました。
ここでは、数式=SQLです。なぜなら、「数理論理学の一部と集合論の数式を命令として定義したものがSQL」だからです。
つまり、SQLの命令は少しの例外を除いて数式で表すことが可能です。
話をもとに戻します。
近年では、「データモデル」という言葉が「テーブル構成」という言葉と同義で使われることが多くなりました。
そもそも、テーブル構成のみを議論したところであまり良いことがありません。
検証することが難しいからです。
「研究に役立つテーブル構成にしました!」「解析しやすいテーブル構成にしました!」
と息巻くのは良いのですが、どのようにしてデータモデルの効果を検証するのでしょうか。
結果、モデル提案者のこだわりをつめこんだだけになります。
ということで、少し伏線になったかもしれませんが、結局データマートというのも
だれかのおもいつきにすぎないだと思ってしまうのです。
コメント