ETLとは
ETLは「Extract(抽出)」「Transform(変換)」「Load(格納)」の略で、複数の情報源からデータを取り出し、分析しやすい形に整えてデータウェアハウスなどへ取り込む一連の処理を指します。専用のETLツールを用い、業務システムのRDBやCSV、表計算、XML、ログ、テキストなど多様な形式に対応します。
変換では、必要な項目の選別、不要や重複の除去、型や単位の統一、値の結合・分割、複数ソースの突合や統合といった加工を行い、分析用の表現に整えます。格納の段階では、対象のデータベースへまとめてデータを流し込みます。取り込みはリアルタイムではなく、日次や週次、月次など定期のバッチで実行されることが一般的です。
ETLを使うことで、ばらばらな業務データを一貫した形にまとめ、分析やレポーティングの準備を自動化できます。その結果、集計の手作業を減らし、意思決定のための信頼できる土台を整える役割を果たします。
関連用語
PR

