データプラットフォーム

データの管理として初めに思いつくことは、データベースにデータを保存する方法であると思われる。

 

しかし、多様な種類のデータを一つのデータベースに保存することはできないので複数のデータベースを作ることになる。

 

すると今度は、これらのデータベースの集まりを管理する必要が生じる。

 

この時に登場するのが、、、

 

データレイクデータウェアハウスである。

 

データレイクでは、加工前の生のデータが保存されている。

ここでは加工の目的が定められていない状態である。

 

一方データウェアハウスでは加工後のデータが保存されている。

ここではデータ加工の目的が決められている状態である。