数据仓库及其工具正在从数据中心转移到基于云的数据仓库。许多大型组织仍在内部运行大型数据仓库——但显然数据仓库的未来在云中。

与传统数据仓库相比,Amazon Redshift 和 Google BIgQuery 等新工具提供了强大的功能、改进的查询性能和无限的可扩展性 - 无需设置成本并加快上市速度。由云数据库和工具组成的大型生态系统可以帮助您入门。

这 12 个基本数据仓库工具可以帮助您构建企业数据解决方案并从您的数据中获取价值 - 在云中轻松且廉价地:

云原生数据仓库

Redshift

Amazon Redshift 是 Amazon Web Services 最受欢迎的云服务之一,它是一个完全托管的分析数据仓库,可以处理 PB 级数据,并使分析师能够在几秒钟内对其进行查询。 Redshift 无需前期成本,即可在 Amazon 架构上提供无限的可扩展性。通过向 Redshift 集群添加节点,或添加更多集群,您可以支持更高的数据量或高并发。 Redshift 有多种替代方案,但它仍然是云数据仓库市场中的佼佼者。

定价:2 个月免费试用,一个 Redshift 实例的定价从每小时 0.25 美元起,对于更大规模的部署,每年每 TB 高达 1,000 美元

数据仓库度量规则(妙手数评数据仓库工具)(1)

BigQuery

Google BigQuery 是另一个企业级云原生数据仓库。与 Redshift 一样,它可以在 PB 级数据集上运行极快的查询。与 Redshift 不同,它是无服务器的,无需管理云实例。 BigQuery 还抽象了在幕后发生的聚类。作为较新的竞争者,BigQuery 添加了许多功能以实现与 Redshift 的同等水平——实时分析、灵活的数据摄取、数据治理、加密、安全性等等。

定价:每月前 10 GB 免费,超出 5 美元/TB 查询数据/月 0.02 美元/GB/月存储的统一定价

数据仓库度量规则(妙手数评数据仓库工具)(2)

Panoply

我们可能有偏见,但我们相信 Panoply 的云数据平台正在改变云数据仓库游戏。 Panoply 将 ETL 和存储结合在一个易于使用的工具中,因此您可以快速同步和存储数据。它的维护成本低,因此您不必时刻关注 API 更改,也不必随着需求的增长手动扩展存储。此外,设置实际上只需要几分钟,而不是传统数据仓库所需的数周或数月。

定价:14 天免费试用,查看完整定价

数据仓库度量规则(妙手数评数据仓库工具)(3)

基于云的 ETL 工具

Stich

Stitch 是一种轻量级 ETL(提取、转换、加载)工具,可将多个数据源汇集在一起​,转换或清理数据,并允许您使用其 UI 配置数据管道。从与数据源(从 MixPanel、Segment 和 Intercom 等云服务到 MySQL、MongoDB 和 MariaDB 等数据库)的预构建集成中传输数据,并将其发送到任何云数据仓库。

定价:每月最多免费 500 万行,付费计划从每月 100 美元起

数据仓库度量规则(妙手数评数据仓库工具)(4)

Blendo

Blendo 是一种数据仓库工具,可让您轻松地将数据源连接到数据仓库。 Blendo 从您连接的云服务加载实时和历史数据 - 按需或使用自动加载计划。它优化了您的数据方案,并提供了一个 UI 来查看统计信息和数据加载问题。 Blendo 将数据从 AdWords、Mailchimp、Salesforce 和 Magento 等来源提取到 Redshift、PosgreSQL、MS SQL Server 和 Panoply 的数据仓库等目的地。

定价:14 天免费试用,1000 万行的定价从每月 100 美元起

数据仓库度量规则(妙手数评数据仓库工具)(5)

Fivetran

Fivetran 将多个数据源加载到中央数据存储库中,让您拥有数据的所有权并控制分析和存档。该平台为 Google BigQuery、MySQL、PostgreSQL、Amazon Redshift、Snowflake 和 SQL Server 等系统提供了大量数据连接器。 Fivetran 可以在数据加载到您的数据仓库时对其进行转换和规范化。

定价:按要求提供企业定价

基于云的 BI 工具

Tableau Online

尽管存在许多替代方案,但 Tableau 以高级分析和漂亮的仪表板而闻名。其 Tableau Online 版本在云中提供了相同的功能。它连接到大数据源,让您发布交互式仪表板并与您的组织共享发现。 Tableau 允许数据科学家、分析师和业务团队对数据进行切片和切块,并创建富有洞察力的可视化。

定价:42 美元/用户/月

数据仓库度量规则(妙手数评数据仓库工具)(6)

Qlik

Qlik Sense 连接到数据源,让您发现超出正式 SQL 查询的洞察力。您可以自由搜索和探索数据,旋转分析以调查假设。它的关联引擎索引数据中所有可能的关系,让您可以切片和切块,而不受限于数据的部分视图。 Qlik 还提供强大的可视化和协作功能。

定价:最多 5 位合作者免费。云版本的起价为 15 美元/用户/月。

数据仓库度量规则(妙手数评数据仓库工具)(7)

Chartio

Chartio 允许您使用交互式查询构建器或 SQL 模式探索数据和构建 SQL 查询。 Chartio 可以使用迷你 ETL 引擎转换数据——预览数据管道并运行转换查询。它帮助用户将组织数据转换为图表和可视化,并设置自动刷新的实时仪表板。

定价:最多 6 位用户,每月 249 美元起

数据仓库度量规则(妙手数评数据仓库工具)(8)

Looker

Looker 是一个基于云的 BI 平台,通过 SQL 查询和分析大型数据集。分析师使用 LookerML(一种简单的数据建模语言)定义指标。 Looker 无需提取数据即可直接连接到数据库或数据仓库,并从您的架构中自动生成数据模型。独一无二的是,它可以直接处理来自源头的新鲜数据,而不是部分或时间提取的数据。

定价:根据要求定制定价

数据仓库度量规则(妙手数评数据仓库工具)(9)

基于云的数据集成工具

Zapier

Zapier 在数百个系统和应用程序之间预先构建了集成,因此您无需自己构建集成。它定义了“触发器”——在一个应用程序中发生的动作,以及“动作”——它可以在该应用程序或其他应用程序中为你做的事情。例如,Zapier 可以检测 Gmail 帐户中收到的新电子邮件,或 Trello 板上的新卡片,并将该数据保存到数据库(它支持 MySQL、PostgreSQL 和 DynamoDB)。这为将非传统数据源拉入数据仓库创造了有趣的可能性。

定价:简单集成永久免费,付费计划从 20 美元/月起,用于集成 3 个以上步骤并访问更多应用程序

数据仓库度量规则(妙手数评数据仓库工具)(10)

IFTTT

IFTTT 代表“如果这个,那么那个”。与 Zapier 类似,它在数百个预先集成的应用程序和云服务之间创建工作流。 IFTTT 比 Zapier 更容易设置和使用,但功能更有限。与 Zapier 不同,IFTTT 不与数据库平台集成,并且仅限于应用程序之间的交互。

定价:免费

数据仓库度量规则(妙手数评数据仓库工具)(11)

数据仓库不再是百万美元的项目

这 12 种数据仓库工具可帮助数据工程师、IT 团队甚至数据分析师在云中设置强大的数据基础架构。云中提供了许多类似的工具,这些工具价格低廉、易于使用,可让您在数天甚至数小时内设置数据管道。

数据仓库曾经是具有数百万美元预算的大型企业项目。在大型组织中仍然如此,尽管他们也想释放云的价值。但是中小型企业现在可以以比以前更少的投资快速建立世界级的数据仓库。

,