云计算通过提供对数据科学项目所需的额外处理能力、存储和其他工具的访问来扩展数据科学。
由于CPDA数据分析师经常利用大型数据集,能够随数据大小伸缩的工具非常重要,特别是对于时间敏感的项目。云存储解决方案,如数据湖,提供对存储基础设施的访问,这些基础设施能够轻松地摄取和处理大量数据。这些存储系统为终端用户提供了灵活性,允许他们根据需要旋转大型集群。他们还可以添加增量计算节点来加速数据处理作业,允许企业为更大的长期结果进行短期权衡。云平台通常有不同的定价模型,如按次使用或订阅,以满足终端用户的需求,无论他们是大型企业还是小型初创企业。
开源技术广泛应用于数据科学工具集。当它们托管在云中时,团队不需要在本地安装、配置、维护或更新它们。包括IBM cloud®在内的一些云提供商也提供了预打包的工具包,使CPDA数据分析师无需编码就可以构建模型,进一步实现了对技术创新和数据洞察的民主访问。
,