一、定义
1、ETL 是“Extract(数据提取)””Transform(数据转换)”和”Load(数据加载)”3 个单词的首字母缩写, ETL 是构建数据仓库和数据挖掘的很重要的一部分。
ETL是BI/DW (商务智能/数据仓库) 的核心和灵魂,按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。
ETL包含了三方面:
①Extract(数据提取):将数据从各种原始的业务系统中读取出来,这是所有工作的前提。② Transform(数据转换):按照预先设计好的规则将抽取得数据进行转换,使本来异构的数据格式能统一起来
③Load(数据加载):将转换完的数据按计划增量或全部导入到数据仓库中。
2、大数据分析
大数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。
二、区别
1、数据作用力的方向
ETL重要的是数据的集成;大数据分析重要的是数据的解破。
2、ETL是数据分析中用到的一种手段
ETL数据仓库建模有实体关系、多维建模、data vault、anchor等。目的是更好的系统化的组织数据。
数据分析在集成的数仓之上,需要庖丁运用解牛之术,来发现数据中存在的规律,内藏的信息。同时也需要数据分析师掌握很多分析工具。
让数据流动起来,开启业绩增长!
了解500+品牌零售商使用LinkFlow的场景用例