您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识
大数据是什么计算的?
数据,数据处理,节点大数据是什么计算的?
发布时间:2019-02-08加入收藏来源:互联网点击:
大数据是什么计算的?
回答于 2019-09-11 08:43:50
回答于 2019-09-11 08:43:50
怎么计算的?用于计算什么的?问题描述不是很清楚。
大数据最早可以追溯到Google提出的MapReduce计算方式,Apache通过Hadoop实现了一个基于MapReduce算法的实现,主要用于大规模数据的处理。它与传统的并行计算有很大的不同,传统的并行计算主要利用的是单台服务器的性能,通过不断的扩展服务器的硬件资源来提高运算效率。而MapReduce主要就是利用多台机器甚至可以是废弃的机器组成集群来将任务分配在不同节点上同时进行运算,以此来提高运算效率。
由于性能方面可以通过不断的扩充节点而得到提升,因此使用成本、扩展性方面都比传统的并行计算要出色得多。
其运算过程如下图:
整个过程可以分成两步:
第一步:Map,将整个计算过程细分,典型的如基因序列比对算法,需要从基因库中查找到匹配的基因;在Map这一步中,会将查找的库中的基因进行细分,每个节点分配一个指定数目的基础序列;然后在每个节点上同时进行序列比较;每个节点上会出来一个比对结果。
第二步:Reduce,将每个节点运算的结果进行汇总,最终返回给调用方。
基于这种原理,再加上目前互联网产生的数据量越来越大,而传统的并行计算所需的硬件资源过于昂贵,因此Hadoop的应用已经越来越广泛。它可以用于文件存储,也可以用于替换传统的数据库来进行数据的收集与统计,也可以用于日志存储分析等方面。
回答于 2019-09-11 08:43:50
大数据是什么计算的,这样的提问真是让我摸不着头脑。
通俗的说大数据是海量的无规律信息,为什么说它作用很大,因为在现在这个时代,可以有效的快速的提供服务,那么企业就可以获得巨大优势,而大数据分析就可以为企业提供你这服务。
说点简单例子,淘宝可以通过大数据分析,可以得知不同用户的需求,这样针对不同的用户提供其相应的服务,例如你想买一个衣服,打开淘宝就有推荐的衣服,并且你也很喜欢,那么你是不觉得淘宝很好用呢。
一般来说大数据需要和云计算配合使用,巨量的数据分析,如果没有高性能的计算机去分析,那么效率就会变得很低,云计算因其拥有大量的服务器,可以快速的完成客户所需的数据分析,从而体现出大数据的重要作用。
欢迎大家说说自己的看法。
喜欢的点个赞,点个关注。
回答于 2019-09-11 08:43:50
大数据是指无法再一定时间范围内用常规软件进行捕捉,管理和处理的数据集合。是需要新处理模式才能具有更强的决策力,洞察发展力和流程优化能力的海量,高增长率和多样化的信息资产。
那么大数据是如何计算的,又是如何发挥其巨大作用的。
首先我们看下历史,历史上我们国家的综合国力一直都是世界之巅,发明创造一直在影响着整个世界。其实我们就是得益于国家巨大的人口基数,能够将各种思想经验进行融合,取长补短进而少走弯路创造出影响世界的理论和发明。因此我们可以大致的看出大数据发挥作用就是大数据进行整合的过程。
大数据必须依赖充足的数据源,比如淘宝京东这部分电商平台,他们所依赖的大数据就是客户在使用电脑和各种数据端口所获取的客户喜好,需求,性格,消费能力,层次等等数据,进而把这些数据进行整个进行精准的推送。整个的过程就是多台计算机组合成的计算群或者直接用超级计算机对现有的储存的数据进行分析从而得出结论的过程。 我们把利用各种手段采集的信息叫做大数据,我们用计算机对这些数据进行计算整理叫做数据处理,数据处理完毕以后,我们使用最终结果作为决策的依据叫做利用大数据。
举一个最简单的例子,我们通过现实或者书本或者经验知道狗喜欢吃肉和骨头,那么这个信息就属于大数据。那么针对不同品种的狗,我们会通过思考或者其他的方法对其进行细化,比如泰迪喜欢吃精肉,黑背喜欢吃肉骨头,比特喜欢吃带血的牛肉等,这个就是数据处理。那么针对各种不同的狗投放不同的肉,这个就是数据应用。
大数据是信息集合的统称,涉及的方面太过广泛,因此通过简单的回答是不肯定详细的,因此有问题可以随时留言,欢迎讨论。
回答于 2019-09-11 08:43:50
感谢邀请!
其实说真的,题主这个问题让我有点摸不着头脑,估计其它很多人也是。
所谓大数据是指符合4v特征的数据群体,包括未处理和处理后的数据。所谓未处理的数据是指企业在日常使用过程中收集到的原始数据,包括机器数据,比如传感器收集到的数据,一般都是生产制造企业才有。还包括产品的使用者在使用操作过程中产生的行为数据,一般都是互联网企业。还包括社交数据等。处理后数据是指将这些原始数据经过数据预处理,数据处理等过程之后产生的有业务含义,人能直接理解,能够反应企业运行情况或者产品的被接受情况的指标数据。
你的意思是不是如何被处理的?
数据处理包括数据预处理,即数据清洗,是将那些脏数据过滤掉。脏数据就是那些数据不一致,有空值,有错误信息,有重复信息等的数据。另外的过程就是数据处理,数据处理是利用各种数据挖掘算法,并包含一定的业务规则对数据进行计算,转换,最终得到想要的数据的过程。
上一篇:广东清远英德属于几线城市?
下一篇:返回列表
相关链接 |
||
网友回复(共有 0 条回复) |