关于大数据,你知道多少?
大数据是什么?
大数据是为决策问题提供服务的复杂而庞大的数据集、大数据技术和大数据应用的总称。数据、技术和应用是大数据的三个要素。大数据集是指一个决策问题所用到的所有可能的数据,通常数据量巨大、来源多样、类型多样;大数据技术是指大数据集获取、存储管理、挖掘分析、可视化等技术;大数据应用是指用大数据集和大数据技术来支持决策活动,是新的决策方法。
大数据的特征——4V
大数据是具有4V特征的数据集。4V特征是指:
(1)价值(value),数据价值巨大但价值密度低;
(2)时效(velocity),数据处理分析要在希望的时间内完成;
(3)多样(variety),数据来源和形式上都是多样的;
(4)大量(volume),数据量要达到PB级别以上。
大数据决策
计算机出现之前,决策依靠手工收集和数据分析,依靠决策者的经验和直觉,即手工方式;后来有了计算机决策支持系统,和商业智能(Business Intelligence,BI),利用自身信息化积累的数据来开展决策。然而,就像医生积累治疗经验一样,自身的数据积累是一个漫长、费钱和困难的工作,只有少数大型企业能够做到。不仅如此,积累的数据也仅仅局限在企业自己生产的数据。
随着技术进步和互联网的普及应用,不论政府、组织、企业还是个人,都越来越有能力获得决策需要的各种数据。这些数据来源多样、类型多样,甚至超过了早期大型企业自身的积累,并且数据分析技术也取得了长足进步,人们可以通过分析这些数据来得到决策依据。这样,一种新型的决策方式就产生了,这就是大数据决策。
大数据决策主要体现在“通过分析不同来源、各种可能的数据来支持决策活动”。
大数据的决策变革有以下三种:
从样本分析到总体分析。
从因果分析到关联分析。
从精确分析到近似分析。
数据流通
数据流通是数据权属的转移,是数据产业的必然环节,包括数据产权转移、使用权授予、开发权授予等。
数据流通分为开放数据、数据共享和数据交易三个方面。
-开放数据:数据免费开放给每个希望使用数据的人,如政府和公共数据资源。
-数据共享:对数据使用对象、使用时间、地点加以限制,在一定范围内开放数据。
-数据交易:数据拥有者根据法律在市场交易规则下进行自由交易。