1.DataStage(收费)
IBM公司的商业软件,很专业的ETL工具,可跨多个企业系统集成数据,能帮助企业从散布在各个系统中的复杂异构信息中获得更多价值,但技术支持比较少,使用难度较大,尤其价格也比较昂贵,中小公司不是很建议使用,后续保障不是很ok。
2.Informatica(收费)
Informatica平台是一套完善的技术,可支持多项复杂的企业级数据集成计划,专业程度与Datastage旗鼓相当,价格上比Datastage便宜一点。不具有数据质量功能,需要以编程方式进行处理,没有任何Web集成功能。Informatica与datastage一样需要更高的学习成本。
3.DataBeam(免费)
DataBeam,新一代数据建设与分析产品,以图形化、搭积木的方式进行数据处理与分析。相比写代码的传统的数据开发模式,DataBeam的积木式拖拽开发效率更高,“零代码”的形式也让其非常易于上手,学习成本低,同时DataBeam也支持多种异构数据源,在一个平台上就能完成数据输入、清洗、统计、AI建模,可以很好的解决企业数仓开发成本高、交付周期长、维护成本高等问题。
4.Kettle(免费)
Kettle是一款国外开源的ETL工具,纯JAVA编写,可以在Window、linux、Unix上运行,中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。