【ざっくり言うと】
データウェアハウス(DWH)とは、分析のためだけに用意された「巨大なデータの冷凍倉庫」のことやで。
- 普段使うシステムとは別の場所に、過去のデータを全部保管しておく場所。
- 「ウェアハウス」は英語で「倉庫」っていう意味や。
- ここにあるデータを使って、これからの売上予測とか戦略を練ったりするんやで。
【詳しく教えて!】
どうも、ワイです。
みなさん、家の冷蔵庫を想像してみてください。
普段の食事を作るための冷蔵庫には、今夜使うお肉や野菜が入ってますよね。これが普通の「データベース」です。
でも、もしあなたがレストランの経営者で、「過去10年分の食材の消費量」を分析したかったらどうします?
家の冷蔵庫に10年分の伝票や食材を詰め込んだら、パンパンになって今の料理が作れなくなっちゃいますよね。
そこで登場するのが、お店の裏にある「業務用の巨大冷凍庫」です。
これがデータウェアハウス(DWH)です。
❄️ 「キッチン」と「倉庫」を分ける理由
普通のデータベースは「今、レジで会計するため」に超高速で動いてます。
一方で、データウェアハウスは「じっくり過去を分析するため」にドッシリ構えてます。
この2つを分けないと、大変なことが起きるんですよ。
💬 職場の風景で見てみよう
Aさん(新人):「先輩、わざわざデータを別の場所(DWH)に移すの面倒くさいっす。普段使ってる売上管理システムのデータベースを直接分析しちゃダメなんですか?」
Bさん(ベテラン):「バカヤロウ! お前、ランチタイムの激混みしてるレジ横で、過去1万件のレシートを広げて計算し始めたらどうなる?」
Aさん:「えっ、邪魔すぎて店員さんに怒られます…というか、レジが止まります。」
Bさん:「だろ? システムも同じなんだよ。分析みたいな『重たい処理』を普段のデータベースでやると、システム全体が重くなって、最悪止まるんだ。」
Aさん:「ひえっ…。」
Bさん:「だから、分析用のデータはBigQueryみたいなDWHにコピーして、そこで思う存分SQLを書いてこねくり回すのがマナーなんだよ。」
Aさん:「なるほど! 棲み分けが大事なんですね!」
GoogleのBigQueryも、実はこの「データウェアハウス」の一種です。
分析専用の場所だからこそ、どれだけ重たい計算をしても、普段の業務システムには指一本触れずに済むわけです。
【結局どういうこと?】
ビジネスの現場では、「日々の業務システムを遅くさせないために、分析用のデータを避難させておく専用の場所」として使います。
まぁ、そんな感じです。


コメント