データ分析基盤グループでデータエンジニアをしている平川です。
近年注目されてきているDataVaultに関して、全3回(予定)で記事を書かせていただく予定です。
第1回の記事では、DataVaultとは何なのか?どんな特徴があるのかを書いていきます。
参考までに、1~3回の内容を紹介しておきます。(内容は変わる可能性が大いにありますのでお許しください🙇♂️)
第1回: DataVaultってなに?どんな特徴があるの? ← 今回はここ
第2回: dbtvaultを使って実際にDataVaultモデリングでテーブルを作ってみた
第3回: BusinessVaultの使い所や特徴的なSatelliteの利用におけるハマったところや良いところ
- これまでのデータモデリング手法
- 3NF
- ディメンショナルモデリング
- DataVaultとは何か?
- Hub
- Link
- Satellite
- モデリングにおける注意点
- DataVaultの優れている点と課題
- DataVaultの優れている点
- 監査能力の高さ
- 取得するデータが増える場合のような変更に対する柔軟性の高さ
- 短いリリースサイクルでDWHを更新することの容易さ
- DataVaultの課題点
- クエリがJOINだらけになる
- 初期構築時に「正しく」Hubを設計することが簡単ではない
- DataVaultの優れている点
- まとめ/次回予告
- Hub
- Link
- Satellite
- 参考資料