文本内容:
习题
4.6请阐述什么是大数据存储1请阐述什么是分布式存储2请阐述什么是3Hadoop请阐述什么是4NoSQL请阐述什么是数据仓库5大数据存储通常是指将那些数量巨大、难于收集、处理、分析的数据集持久化到计算1机中在进行大数据分析之前,首先的步骤就是要将海量的数据存储起来,以便今后的使用分布式存储最早是由谷歌提出的,其目的是通过廉价的服务器来提供使用与大规模,高并2发场景下的访问问题与常见的集中式存储技术不同,分布式存储技术并不是将数据存Web储在某个或多个特定的节点上,而是通过网络使用企业中的每台机器上的磁盘空间,并将这些分散的存储资源构成一个虚拟的存储设备,数据分散的存储在企业的各个角落3是软件基金会旗下的一个开源分布式计算平台以分布式文件Hadoop ApacheHadoop系统和的开源实现为核Hadoop distributedfile system,HDFS MapReduceGoogle MapReduce心的为用户提供了系统底层细节透明的分布式基础架构Hadoop4数据库又叫作非关系数据库,和数据库管理系统相比,不使用NoSQL RDBMSNoSQL SQL作为查询语言,其存储也可以不需要固定的表模式,用户操作时通常会避免使用NoSQL RDBMS的操作JION数据仓库简称顾名思义,数据仓库是一个很大的数据存储集合,5Data WarehouseDW,出于企业的分析性报告和决策支持目的而创建,并对多样的业务数据进行筛选与整合通常,数据定期从事务系统、关系数据库和其他来源流入数据仓库。