データプラットフォーム
データの管理として初めに思いつくことは、データベースにデータを保存する方法であると思われる。
しかし、多様な種類のデータを一つのデータベースに保存することはできないので複数のデータベースを作ることになる。
すると今度は、これらのデータベースの集まりを管理する必要が生じる。
この時に登場するのが、、、
データレイクとデータウェアハウスである。
データレイクでは、加工前の生のデータが保存されている。
ここでは加工の目的が定められていない状態である。
一方データウェアハウスでは加工後のデータが保存されている。
ここではデータ加工の目的が決められている状態である。