您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识
怎么简单理解“大数据”及其应用?
数据,用户,疫情怎么简单理解“大数据”及其应用?
发布时间:2019-02-08加入收藏来源:互联网点击:
目前的大数据应用,还没有达到ZB级,主要集中在PB/EB级别。
大数据的级别定位
1 KB = 1024 B (KB - kilobyte)
1 MB = 1024 KB (MB - megabyte)
1 GB = 1024 MB (GB - gigabyte)
1 TB = 1024 GB (TB - terabyte)
1 PB = 1024 TB (PB - petabyte)
1 EB = 1024 PB (EB - exabyte)
1 ZB = 1024 EB (ZB - zettabyte)
/03
数据的来源
数据的增长,为什么会如此之快?
说到这里,就要回顾一下人类社会数据产生的几个重要阶段。
大致来说,是三个重要的阶段。
第一个阶段,就是计算机被发明之后的阶段。尤其是数据库被发明之后,使得数据管理的复杂度大大降低。各行各业开始产生了数据,从而被记录在数据库中。这时的数据,以结构化数据为主(待会解释什么是“结构化数据”)。数据的产生方式,也是被动的。
世界上第一台通用计算机-ENIAC
第二个阶段,是伴随着互联网2.0时代出现的。互联网2.0的最重要标志,就是用户原创内容。随着互联网和移动通信设备的普及,人们开始使用博客、facebook、youtube这样的社交网络,从而主动产生了大量的数据。
第三个阶段,是感知式系统阶段。随着物联网的发展,各种各样的感知层节点开始自动产生大量的数据,例如遍布世界各个角落的传感器、摄像头。
经过了“被动-主动-自动”这三个阶段的发展,最终导致了人类数据总量的极速膨胀。
/04
大数据的4个V
行业里对大数据的特点,概括为4个V。
前面所说的庞大数据体量,就是Volume(海量化)。除了Volume之外,剩下三个,分别是Variety、Velocity、Value。
我们一个一个来介绍。
Variety(多样化)
数据的形式是多种多样的,包括数字(价格、交易数据、体重、人数等)、文本(邮件、网页等)、图像、音频、视频、位置信息(经纬度、海拔等),等等,都是数据。
数据又分为结构化数据和非结构化数据。
从名字可以看出,结构化数据,是指可以用预先定义的数据模型表述,或者,可以存入关系型数据库的数据。
结构化数据
例如,一个班级所有人的年龄、一个超市所有商品的价格,这些都是结构化数据。
而网页文章、邮件内容、图像、音频、视频等,都属于非结构话数据。
在互联网领域里,非结构化数据的占比已经超过整个数据量的80%。
大数据,就符合这样的特点:数据形式多样化,且非结构化数据占比高。
Velocity(时效性)
大数据还有一个特点,那就是时效性。从数据的生成到消耗,时间窗口非常小。数据的变化速率,还有处理过程,越来越快。例如变化速率,从以前的按天变化,变成现在的按秒甚至毫秒变化。
我们还是用数字来说话:
就在刚刚过去的这一分钟,数据世界里发生了什么?
Email:2.04亿封被发出
Google:200万次搜索请求被提交
Youtube:2880分钟的视频被上传
Facebook:69.5万条状态被更新
Twitter:98000条推送被发出
12306:1840张车票被卖出
……
怎么样?是不是瞬息万变?
Value(价值密度)
最后一个特点,就是价值密度。
大数据的数据量很大,但随之带来的,就是价值密度很低,数据中真正有价值的,只是其中的很少一部分。
例如通过监控视频寻找犯罪分子的相貌,也许几TB的视频文件,真正有价值的,只有几秒钟。
2014年美国波士顿爆炸案,现场调取了10TB的监控数据(包括移动基站的通讯记录,附近商店、加油站、报摊的监控录像以及志愿者提供的影像资料),最终找到了嫌疑犯的一张照片。
/05
大数据的价值
刚才说到价值密度,也就说到了大数据的核心本质,那就是价值。
人类提出大数据、研究大数据的主要目的,就是为了挖掘大数据里面的价值。
大数据,究竟有什么价值?
2012年的世界经济论坛指出:“数据已经成为一种新的经济资产类别,就像货币和黄金一样”。这无疑将大数据的价值推到了前所未有的高度层面上。
如今,大数据应用开始走进我们的生活,影响我们的衣食住行。
滴滴的大数据杀熟,相信大家都有所耳闻
之所以大数据会有这么快的发展,就是因为越来越多的行业和企业,开始认识到大数据的价值,开始试图参与挖掘大数据的价值。
归纳来说,大数据的价值主要来自于两个方面:
1 帮助企业了解用户
大数据通过相关性分析,将客户和产品、服务进行关系串联,对用户的偏好进行定位,从而提供更精准、更有导向性的产品和服务,提升销售业绩。
典型的例子就是电商。
像阿里淘宝这样的电子商务平台,积累了大量的用户购买数据。在早期的时候,这些数据都是累赘和负担,存储它们需要大量的硬件成本。但是,现在这些数据都是阿里最宝贵的财富。
通过这些数据,可以分析用户行为,精准定位目标客群的消费特点、品牌偏好、地域分布,从而引导商家的运营管理、品牌定位、推广营销等。
大数据可以对业绩产生直接影响。它的效率和准确性,远远超过传统的用户调研。
除了电商,包括能源、影视、证券、金融、农业、工业、交通运输、公共事业等,都是大数据的用武之地。
大数据甚至能够帮助竞选总统
2 帮助企业了解自己
除了帮助了解用户之外,大数据还能帮助了解自己。
企业生产经营需要大量的资源,大数据可以分析和锁定资源的具体情况,例如储量分布和需求趋势。这些资源的可视化,可以帮助企业管理者更直观地了解企业的运作状态,更快地发现问题,及时调整运营策略,降低经营风险。
总而言之,“知己知彼,百战百胜”。大数据,就是为决策服务的。
/06
大数据和云计算
说到这里,我们要回答一个很多人心里都存在的疑惑——大数据和云计算之间,到底有什么关系?
可以这么解释:数据本身是一种资产,而云计算,则是为挖掘资产价值提供合适的工具。
从技术上,大数据是依赖于云计算的。云计算里面的海量数据存储技术、海量数据管理技术、分布式计算模型等,都是大数据技术的基础。
云计算就像是挖掘机,大数据就是矿山。如果没有云计算,大数据的价值就发挥不出来。
相反的,大数据的处理需求,也刺激了云计算相关技术的发展和落地。
也就是说,如果没有大数据这座矿山,云计算这个挖掘机,很多强悍的功能都发展不起来。
套用一句老话——云计算和大数据,两者是相辅相成的。
/07
大数据和物联网(5G)
第二个问题,大数据和物联网有什么关系?
这个问题我觉得大家应该能够很快想明白,前面其实也提到了。
物联网就是“物与物互相连接的互联网”。物联网的感知层,产生了海量的数据,将会极大地促进大数据的发展。
同样,大数据应用也发挥了物联网的价值,反向刺激了物联网的使用需求。越来越多的企业,发觉能够通过物联网大数据获得价值,就会愿意投资建设物联网。
上一篇:如何短期提升整体颜值呢?
下一篇:返回列表
相关链接 |
||
网友回复(共有 0 条回复) |