BI(Bussiness Intelligence)ツールについてのメモ

仕事でとある商用BIツールを使う機会があったので、調べたことをメモ。

初めて使ったのでかなり当たり前のことばかり書いてます。

BIツールの目的:

ERPパッケージやPOSなど、企業が管理している売上データなどを分析し、意思決定の支援を行うためのツール。

例えば、チェーン展開している店舗の売上を地域別・商品別・日付別に集計・予測、仕入れや予算の決定に役立てるなど、データウェアハウスと連携した分析を行うことが主な目的。

BIを使う理由:

データの構造

通常の業務でアクセスするデータベースは高速に集計を行うことに適した構造ではないことが多いため、通常はBIツールで分析を行う上で都合の良い構造(スタースキーマスノーフレークスキーマなど)へ変換(ETL)し、データウェアハウスへデータを投入する。

「都合の良い構造」と表現したが、これは例えば「日付・地域・売上を持つテーブルをJOINして対象フィールドを関連付けるだけで日付・地域別売上集計表が作成できる」といった形である。通常、売上げデータなどをファクトと呼び、日付や地域等の分析の軸となる項目をディメンションと呼ぶ。

このように、複雑で分析的な用途で都合の良い形へデータ構造を変換し、集計・予測・データマイニングを行うことをOLAPという。

ところでなぜ最初からこのようなスキーマで業務データを構築しないのか?というと、マスターデータ、マスターテーブルの変更、取引データの削除や更新に適さないからである(当たり前ではあるが)。

構造が変わった分、元々のデータ構造で定義されていたリレーションは使えないため貼り直す必要がある。

結果の出力

BIツールを使うメリットとしては結果の出力が容易であるということ。

 「年度ごと、月ごと」などの時間的なディメンション、「地域ごと、商品ごと、購入者年齢ごと」といったディメンションの組み合わせを選ぶだけで、適切な表やグラフを自動的に作ってくれる。

たったこれだけのことではあるが、やはりプログラミングに詳しくない一利用者が簡単に、思い通りにレポートを作成出来るということが最大のメリットのようだ。

 

 

今回はとりあえずここまで。