Cloud Data Fusion
機能
データパイプラインの構築と管理を行うための統合環境
GUI上で完結して手軽にデータパイプランを作成することが可能
使用するにはインスタンスの作成が必要で、パイプラインの実行には、Dataprocクラスタを使用する。
ETL処理はDataprocにより実施
GUIではノードを接続してパイプラインを構成する。
例として以下のようなノードがある。
GCS
HTTP ... あるAPIのURLにアクセスしデータを取得する。
CSVParser
Wrangler ... 文字コード変換など実施可能。(BigQueryは基本的にUTF-8にしか対応していないため。フラットデータのみISO-8859-1に対応)
BigQuery
Last updated