複製鏈接
請複製以下鏈接發送給好友

ETL

(數據倉庫技術)

鎖定
ETL,是英文Extract-Transform-Load的縮寫,用來描述將數據從來源端經過抽取(extract)、轉換(transform)、加載(load)至目的端的過程。ETL一詞較常用在數據倉庫,但其對象並不限於數據倉庫。
軟件名稱
Extract, transform, load
過    程
抽取、清洗、轉換、裝載
應    用
Informatica、OWB、DataStage、Beeload
數據集成
快速實現ETL

目錄

ETL簡介

ETL是將業務系統的數據經過抽取、清洗轉換之後加載到數據倉庫的過程,目的是將企業中的分散、零亂、標準不統一的數據整合到一起,為企業的決策提供分析依據, ETL是BI(商業智能)項目重要的一個環節。

ETLETL與ELT

ETL所描述的過程,一般常見的作法包含ETL或是ELT(Extract-Load-Transform),並且混合使用。通常越大量的數據、複雜的轉換邏輯、目的端為較強運算能力的數據庫,越偏向使用ELT,以便運用目的端數據庫的平行處理能力。

ETL工具

ETL(orELT)的流程可以用任何的編程語言去開發完成,由於ETL是極為複雜的過程,而手寫程序不易管理,有越來越多的企業採用工具協助ETL的開發,並運用其內置的metadata功能來存儲來源與目的的對應(mapping)以及轉換規則。
工具可以提供較強大的連接功能(connectivity)來連接來源端及目的端,開發人員不用去熟悉各種相異的平台及數據的結構,亦能進行開發。
當然,為了這些好處,付出的代價便是金錢。

ETL參見