本記事ではデータウェアハウスのひとつであるSnowflakeを紹介します。

データウェアハウスとは

データウェアハウスとは、何かを決めるときにその根拠となるデータの集まりを言います。

ビジネスシーンにおいては基幹システムなどから事業での問題や課題に有用な形でデータを集め、その集約場所が「データウェアハウス」ということになります。

データウェアハウスの定義

Wikipediaよりデータウェアハウスは以下のように定義されています。

データウェアハウスは、意志決定(Decision)のため、目的別Purpose-oriented)に編成され、統合(Integrate)された時系列で、削除(Delete)や更新(Update)しないデータの集合体」とされる。

まとめると以下になります。

  1. 意思決定のために目的別に編成・統合

データを分析して意志決定に役立てるため、複数の基幹系システムからデータを収集し、蓄積します。 

実際にはあらゆるデータをデータウェアハウスに蓄積・一元管理し、目的別にデータマートを作成して利用することが多いようです。

  1. 時系列に蓄積

過去のデータの蓄積と現在との比較ができます。

  1. 更新・削除をしない

あらゆるデータを蓄積することから、データの更新や削除は行いません。

Snowflakeも上記のような考えのもと作られてはいますが、実際には、データ収集するといっても、すべてのデータを収集するわけではないですし、データベースのようにデーターの更新や削除もやろうと思えばできます。 

それではなぜデータウェアハウスを使うのかといえば、「データを分析して意志決定に役立てるため、複数の基幹系システムからデータを収集し、蓄積します。」という一文につきるのかと思います。

Snowflakeとは

Snowflake(https://www.snowflake.com/)とは、米国Snowflake.Inc(本社:米国カリフォルニア州サンマテオ)が提供するクラウド向けに構築されたデータウェアハウスです。  

データウェアハウスというのは簡単に説明するとデータの集まりです。  

データの集まりというとデータベースとどのように違うのかと思われるかもしれません。  データウェアハウスは分析し易いようにデータを集めているのです。

Snwoflakeの特徴

SnowflakeはSaaS(Software-as-a-Service)として提供されています。 

サービスとして提供されているのでハードウェア(仮想または物理)の選択、インストール、構成、また管理の必要がありません。  

Snowflakeに保守や管理、調整を任せることができます。

Snowflakeのフリートライアルに登録してみる

Snowflakeは30日間、無料で試すことができるので登録してみました。

  1. Snowflakeのサイトにアクセスします。
  1. 右上の 【START FOR FREE】をクリックします。
  1. 必要事項を入力します。
  1. Snowflake Edition と クラウドプロバイダーを選択し、自分の電話番号を入力します。
  • Snowflake Edition

無料なのでいろんな機能が使える 『エンタープライズ』 にしましょう。

  • クラウドプロバイダー

連携したいクラウドサービスに合わせて選択します。ここでは AWS を選択しました。

  1. 【はじめる】をクリックします

SnowflakeアカウントURLへのアクティベーションリンクが記載されたメールが登録したメールアドレスに届きます。      

【CLICK TO ACTIVATE】 ボタンを押して、ユーザーとパスワードを登録します。     

登録が完了すると以下の画面が初めに表示されます。

さいごに

Snowflakeはとても簡単に登録することができます。

  データウェアハウスとはどんなものなのか。  

Snowflakeとはどんなのもなのか。  

まずは試してみるのはいかがでしょうか。