零基础也能看懂!数据仓库与数据库的这几个问题,你能回答出来吗( 三 )


小结在大数据时代 , 数据仓库的重要性更胜以往 。Hadoop平台下的Hive , Spark平台下的Spark SQL都是各自生态圈内应用最热门的配套工具 , 而它们的本质就是开源分布式数据仓库 。
在国内的互联网公司里 , 很多数据引擎是架构在数据仓库之上的 。不少员工认为 , 开发成本应更多集中在数据仓库层 , 不断加大数据建设的投入 。
因为一旦规范、标准、高性能的数据仓库建立好了 , 在之上进行数据分析、数据挖掘、跑推荐算法等都是轻松惬意的事情 。反之如果业务数据没梳理好 , 各种脏乱数据会搞得人焦头烂额 , 苦不堪言 。

【零基础也能看懂!数据仓库与数据库的这几个问题,你能回答出来吗】


推荐阅读