data warehouse(可简写为DW或者DWH)数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它是一整套包括了etl、调度、建模在内的完整的理论体系数据仓库的方案建设的目的,是为前端查询和分析作为基础,主要应用于OLAP(on-line Analytical Processing),支持复杂的分析操作,侧重决策支持,听且提供直观易懂的查询结果比较流行的有:AWS Redshift,Greenplum,Hive等,现在小编就来说说关于简述数据库与数据仓库的需求分析?下面内容希望能帮助到你,我们来一起看看吧!

简述数据库与数据仓库的需求分析(数据仓库分层中的ODS)

简述数据库与数据仓库的需求分析

1.数据仓库DW1.1简介

data warehouse(可简写为DW或者DWH)数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它是一整套包括了etl、调度、建模在内的完整的理论体系。数据仓库的方案建设的目的,是为前端查询和分析作为基础,主要应用于OLAP(on-line Analytical Processing),支持复杂的分析操作,侧重决策支持,听且提供直观易懂的查询结果。比较流行的有:AWS Redshift,Greenplum,Hive等。

1.2主要特点1.3与数据库的对比

特性

数据仓库

事务数据库

适合的工作负载

分析、报告、大数据

事务处理

数据源

从多个来源收集和标准化的数据

从单个来源(例如事务系统)捕获的数据

数据捕获

批量写入操作通过按照预定的批处理计划执行

针对连续写入操作进行了优化,因为新数据能够最大程度地提高事务吞吐量

数据标准化

非标准化Schema,例如星型Schema或雪花型schema

高度标准化的静态schema

数据存储

使用列式存储进行了优化,可实现轻松访问和高速查询性能

针对在单行型物理块中执行高吞吐量写入操作进行了优化

数据访问

为最小化I/O并最大化数据吞吐量进行了优化

大量小型读取操作

2.数据分层

数据分层,每个企业根据自己的业务需求可以分成不同的层次,但是最基础的分层思想,理论上数据分为三个层:数据运营层、数据仓库层、数据服务层。基于这个基础分层之上,再提交信息的层次,来满足不同的业务需求。

2.1数据运营层(ODS)2.2数据仓库层(DW)

DW数据分层,由下到上为DWD,DWB,DWS。

2.3数据服务层/应用层(ADS),