データ分析– tag –
-
Databricks
Delta Lakeとは?
データ分析基盤を作る際、安価に大量のファイルを格納できる「データレイク」は非常に便利ですが、運用していくうちにいくつかの根本的な課題に直面します。 更新や削除がしにくい(ファイルは追記が基本) 書き込み途中でジョブが失敗すると、中途半端に... -
Databricks
Azure Databricksを構築する
仕事で知っておく必要があり、最近Databricks Free Editionを触っていたのですが、一部制限されていて全体像を把握しにくいことが判明。調べてみると、構築だけなら費用かけずにAzureですぐにできそうだったので構築してみました。 ※個人的な試用版のため...
1
