データウェアハウス (DWH)とは何かざっくり解説!

業務効率化

【ざっくり言うと】

データウェアハウス(DWH)とは、分析のためだけに用意された「巨大なデータの冷凍倉庫」のことやで。

  • 普段使うシステムとは別の場所に、過去のデータを全部保管しておく場所。
  • 「ウェアハウス」は英語で「倉庫」っていう意味や。
  • ここにあるデータを使って、これからの売上予測とか戦略を練ったりするんやで。

【詳しく教えて!】

どうも、ワイです。

みなさん、家の冷蔵庫を想像してみてください。
普段の食事を作るための冷蔵庫には、今夜使うお肉や野菜が入ってますよね。これが普通の「データベース」です。

でも、もしあなたがレストランの経営者で、「過去10年分の食材の消費量」を分析したかったらどうします?
家の冷蔵庫に10年分の伝票や食材を詰め込んだら、パンパンになって今の料理が作れなくなっちゃいますよね。

そこで登場するのが、お店の裏にある「業務用の巨大冷凍庫」です。
これがデータウェアハウス(DWH)です。

❄️ 「キッチン」と「倉庫」を分ける理由

普通のデータベースは「今、レジで会計するため」に超高速で動いてます。
一方で、データウェアハウスは「じっくり過去を分析するため」にドッシリ構えてます。

この2つを分けないと、大変なことが起きるんですよ。

💬 職場の風景で見てみよう

Aさん(新人):「先輩、わざわざデータを別の場所(DWH)に移すの面倒くさいっす。普段使ってる売上管理システムのデータベースを直接分析しちゃダメなんですか?」

Bさん(ベテラン):「バカヤロウ! お前、ランチタイムの激混みしてるレジ横で、過去1万件のレシートを広げて計算し始めたらどうなる?」

Aさん:「えっ、邪魔すぎて店員さんに怒られます…というか、レジが止まります。」

Bさん:「だろ? システムも同じなんだよ。分析みたいな『重たい処理』を普段のデータベースでやると、システム全体が重くなって、最悪止まるんだ。」

Aさん:「ひえっ…。」

Bさん:「だから、分析用のデータはBigQueryみたいなDWHにコピーして、そこで思う存分SQLを書いてこねくり回すのがマナーなんだよ。」

Aさん:「なるほど! 棲み分けが大事なんですね!」

GoogleのBigQueryも、実はこの「データウェアハウス」の一種です。
分析専用の場所だからこそ、どれだけ重たい計算をしても、普段の業務システムには指一本触れずに済むわけです。


【結局どういうこと?】

ビジネスの現場では、「日々の業務システムを遅くさせないために、分析用のデータを避難させておく専用の場所」として使います。

まぁ、そんな感じです。

コメント

タイトルとURLをコピーしました