什么是大数据概念
时间:05-11
大数据是指在传统数据处理方法难以处理的庞大、复杂和多样化的数据集。这些数据集合具有如下四个关键特征:海量(Volume)、多样性(Variety)、快速(Velocity)和价值密度低(Value Density)。
1. 海量 (Volume):指数据的数量巨大且增长迅速,远远超出传统数据库软件的容量范围;如全球互联网用户每年产生的数据量约为5EB (Exabytes)。
2. 多样性 (Variety): 数据不仅包括结构化数据(如关系型数据库中的表格),还包括非结构化数据(如文本、图像和视频),以及半结构化数据(如XML或HTML文件);这种多元化为大数据分析提供了丰富的信息来源。
3. 快速 (Velocity): 指数据的生成速度非常快并在不断地实时更新变化; 如社交网络上的实时评论与互动等动态数据流源源不断产生并需要即时处理。
价值密度低(Value Density): 大数据中虽然包含大量冗余信息和无关内容,但也蕴含着巨大的潜在价值和应用前景需要通过相应的技术手段进行提炼和处理后才能得以挖掘和利用。
1. 海量 (Volume):指数据的数量巨大且增长迅速,远远超出传统数据库软件的容量范围;如全球互联网用户每年产生的数据量约为5EB (Exabytes)。
2. 多样性 (Variety): 数据不仅包括结构化数据(如关系型数据库中的表格),还包括非结构化数据(如文本、图像和视频),以及半结构化数据(如XML或HTML文件);这种多元化为大数据分析提供了丰富的信息来源。
3. 快速 (Velocity): 指数据的生成速度非常快并在不断地实时更新变化; 如社交网络上的实时评论与互动等动态数据流源源不断产生并需要即时处理。
价值密度低(Value Density): 大数据中虽然包含大量冗余信息和无关内容,但也蕴含着巨大的潜在价值和应用前景需要通过相应的技术手段进行提炼和处理后才能得以挖掘和利用。