您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识
到底什么是大数据,大数据职业的具体工作内容是什么?
数据,工程师,分析师到底什么是大数据,大数据职业的具体工作内容是什么?
发布时间:2020-12-06加入收藏来源:互联网点击:
到底什么是大数据,大数据职业的具体工作内容是什么?
回答于 2019-09-11 08:43:50
回答于 2019-09-11 08:43:50
感谢邀请!我将从以下几个方面回答您的问题。
什么是大数据?
我们如果从字面意思理解的话,大家的第一反应就是庞大的数据规模,其实大数据的这个大不光是大量/大规模的意思,还有复杂多样等方面的意思。所以咱们可以从以下几点来总结大数据的“大”。
1、海量数据
大数据的大量性是指数据量的大小。
2、复杂多样
大数据的多样性是指数据的种类、关系和来源是多样化的,数据可以是结构化的、半结构化的以及非结构化的,数据的呈现形式包括但不仅限于文本,图像,视频,HTML页面等等。
3、高增长率
大数据的高速性是指数据增长快速,处理快速,每一天,各行各业的数据都在呈现指数性爆炸增长。在许多场景下,数据都具有时效性,如搜索引擎要在几秒中内呈现出用户所需数据。企业或系统在面对快速增长的海量数据时,必须要高速处理,快速响应。
4.、价值密度低
大数据的低价值密度性是指在海量的数据源中,真正有价值的数据少之又少,许多数据可能是错误的,是不完整的,是无法利用的。言简意赅的说,有价值的数据占数据总量的密度极低,当你提炼时,那简直就是大浪淘沙。
5.、真实性
大数据的真实性是指数据的准确度和可信赖度,代表数据的质量。
所以,我们可以理解什么是大数据:符合以上特征的海量数据,往往在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,所以大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
大数据的价值所在
大数据的核心价值,我觉得需要从企业的经营管理、业务运作层面去分析,可以把数据的价值分为两个方面,一方面是给企业创造营收,另一方面是给企业节省成本。具体体现在以下三个维度上:
1、数据辅助经营管理、战略、业务决策
比如,为企业管理者提供基础的数据统计和各维度的分析报表,以便支撑全面了解企业经营情况、战略执行情况、业务运转情况;为风控人员提供用户、交易、履约等维度的分析报告来辅助风控策略的优化;为产品经理提供分析报告可辅助其完善产品功能和改善用户体验;为运营人员提供分析报告可辅助其发现运营问题并确定运营的策略和方向。所以一般对于一个中大型企业来说,都会自己的BI系统。
2、数据驱动业务
通过数据产品、数据挖掘模型实现企业产品和运营的智能化,从而极大的提高企业的整体效能产出。最常见的应用领域有基于个性化推荐技术的精准营销服务、广告服务、基于模型算法的风控反欺诈服务征信服务等。
3、数据对外变现
基于业务本身或从第三方渠道整合的数据,通过对数据进行查重、清洗、质检等处理,从而封装成数据产品,来对外提供数据服务,从而获得现金收入。在当今大数据时代,市场上其实很常见,比如:各种大数据公司利用自己掌握的大数据,提供风控查询、核验、反欺诈、征信等服务;提供引流、精准的智慧营销等服务;提供数据接口平台等服务。
大数据职业的选择思路
针对大数据职业的选择思路,我觉得可以结合三方面去考虑,一是喜好,人只有选择自己最感兴趣的细分领域,才能经得住折磨和考验,才能耐得住性子深耕做好。比如你对大数据方向的数据挖掘岗位感兴趣。二是擅长,不见得你感兴趣的就是你擅长的,所以也要审视一下感兴趣的那个点的技能要求,你是否擅长。三是趋势,你所感兴趣和擅长的领域在行业大环境中是否是未来发展趋势。
大数据职业具体工作内容
至于大数据职业的具体工作内容,这个得看是什么岗位了。
比如数据挖掘工程师,其就需要掌握数据建模、算法实现、BI和机器学习等技能。
比如大数据架构师,其就需要掌握技术架构选型与设计、算法设计、大数据开发和数据分析与挖掘等技能。
比如数据科学家,其就需要掌握数据模型设计与开发、数据分析方法、数据挖掘等技能。
从以上不同岗位的要求能看出,大数据也是一门综合学科,而其中对数学模型的理解与设计、算法、数据挖掘要求较高,所以当你在选择大数据方向的职业时,还是要从自己最擅长的技能分支去考虑,只要精通掌握其中一个分支,就能发挥自身价值,做出成绩。
信息创造价值,学习使人进步。
我是泰瑞聊科技,为您打开科技生活,感谢您阅读与关注!
回答于 2019-09-11 08:43:50
很高兴能够回答这个问题。之前写了一篇关于大数据概念、特征及职业的文章,有兴趣的可以点开我的主页查找进行浏览。关于这个回答我将简单提及一下大数据的概念、重点介绍大数据的职业。
大数据概念
大数据由巨型数据集组成,这些数据集大小常超出人类在可接受时间下的收集、运用、管理和处理能力。麦塔集团(META Group,现为高德纳)分析员道格·莱尼(Doug Laney)指出大数据的挑战和机遇有三个方向:量(Volume,数据大小)、速(Velocity,数据输入输出的速度)与多变(Variety,多样性),合称“3V”或“3Vs”。高德纳与现在大部分大数据产业中的公司,都继续使用3V来描述大数据。高德纳于2012年修改对大数据的定义:“大数据是大量、高速、多变的信息资产,它需要新型的处理方式去促成更强的决策能力、洞察力与最优化处理。”另外,有机构在3V之外定义第4个V:真实性(Veracity)为第四特点。后来,人们意识到数据的价值高密度低的特性,又添加了value。
大数据必须借由计算机对数据进行统计、比对、解析方能得出客观结果。美国在2012年就开始着手大数据,奥巴马更在同年投入2亿美金在大数据的开发中,更强调大数据会是之后的未来石油。数据挖掘(data mining)则是在探讨用以解析大数据的方法。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于特殊大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
上一篇:有没有好用的止痒控油洗发水?
下一篇:返回列表
相关链接 |
||
网友回复(共有 0 条回复) |