您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识
大数据为什么知道我在想什么?
数据,你的,给你大数据为什么知道我在想什么?
发布时间:2019-02-08加入收藏来源:互联网点击:
我们下载一个新闻资讯APP,正常来说他们会请求一些权限,包括了位置信息、设备信息(设备通话状态和识别码)、储存权限还有一些人不会开放的通讯录信息。从位置信息可以直观的判断出你在哪个城市当中,从你的设备信息则可以判断出你用的是什么手机型号,通讯录信息可以读出你的关系网。然后我们打开APP注册,这个注册也就暴露了你的手机号信息了。此外我们会完善一些个人信息,这个个人信息根据你自己的情况,可能会暴露的有性别、生日、行业和地区等等。
注册完后我们就开始浏览新闻了,我们看到一条明星八卦的信息点进去了,看了几分钟,大数据初步判断你是喜欢娱乐新闻的,我们再看看其他的,比如看到一个爱护眼睛的新闻,我们又看了,大数据判断你可能在眼睛方面有需求。同时通过推送一些相同或者互补的新闻,来完成他的判断。在根据你不断的浏览来修正对你的判断。你可能点了个喜欢,收藏了一下,转发了一下,又或者刚点进去看了两秒就退出了。大数据都可以依据此来判断你的喜好。
所以你或许看过一些近视类型的文章或者搜索过近视眼睛等等的信息,让大数据判断出你近视了。
数据分析手段
如果仅仅是根据我们所暴露的一些信息的话,大数据还很难做到说比你更了解你自己。所以更重要的是大数据的数据分析手段,其算法模型。比较常用的数据分析手段包括了分类、回归、聚类、相似匹配、频繁项集、链接预算、因果分析等等的手段。我们简单的说一下就好了。
例如我们根据上面暴露的信息,系统会给我们打标签分类,例如喜欢娱乐信息、性别女的、使用华为手机的、从事IT行业的用户。同时呢,系统会把打上同样标签的用户的喜好进行匹配。比如非常多打上了喜欢烹饪和摄影标签的用户都喜欢美食,那我也测试一下你是不是也喜欢美食,尝试给你推送一些美食的信息,如果你有去看的话也就给你补充标签了。通过这些算法,逐步就建立出你的用户画像了。
所以不一定是你暴露自己近视了或者想要治疗近视。而是你同类标签的用户都有这样的行为,系统就给你尝试推送了。
回答于 2019-09-11 08:43:50
大数据会根据根据你平时的浏览习惯,用户行为抓取你集中的数据,进而将你想看的内容推荐给你的(个人看法)
回答于 2019-09-11 08:43:50
谢谢邀请。
什么事大数据
官方一点的说法,那就是:大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
通俗一点的来讲,那就是数据量太多太大了,用以前的方法对数据进行价值的挖掘和分析已经不管用了。
大数据怎么知道人在想什么?
在说这个问题之前,我们不得不先承认的一个事实就是:大部分数据都是具有价值的,并且,数据很大程度上反映某个人在某些时间段里的某种需求。推荐给你的东西,只是模型觉得你会需要这个东西的概率很大而已。
严格的来说,头条里的推荐系统是经过机器学习训练出来的模型。也就是说,在每天人们产生多种多样的数据的时候,通过对数据的清洗、过滤等手段产生有价值的数据,最后喂给模型,让模型产生一定的预测功能。在你搜素这个之前之前,头条的推荐系统早已经通过大量的数据进行训练了,然后预测了你的需求。就像典型的啤酒尿布的例子一样。当然,比较容易的一种做法就是你搜索了什么,就给你推荐和你搜索相关的内容信息给你。
还有一种算法叫做协同过滤。正所谓物以类聚,人与群分。对于口味相似的人,其兴趣点很大程度上会一样。也就是说通过你的用户画像或者其他数据,计算了你和其他用户的相似度,进而如果另一个和你相似的人浏览了相似的内容的时候还看过其他哪些东西,再推荐给你,很大程度上来说或许会是你需要的。
最后,喜欢的小伙伴可以给我点赞或者关注我哦。
回答于 2019-09-11 08:43:50
不请自来~
首先,大数据从你之前的行为分析与购买记录、搜索关键词、IP等等,已经分析出了你的性别、偏好、风格等等,就是所谓已经掌握了你的“用户画像”。大数据可能分析出了你近视,因此根据算法会推送你一些近视相关的,比如“定向广告”,如配镜、飞秒手术等等。那么这篇文章,也是大数据根据特定人群精准投放的,头条是数据流量王,也有大量的用户信息和很强的算法能力,因此你被推荐也就是很平常的事情啦。
这样的定向推荐给我们很多便利之处,但也有一些负面的作用:这就是“过滤泡泡(The Filter Bubble)”,就是互联网服务根据你的个人特征、行为和在互联网上的社会关系,做出的个性化内容定制。
用户因此只接触到“过滤泡泡”精心定制的内容,这些内容无法反映真实世界的样子,只能呈现特定的狭隘观点。“过滤泡泡”把相似的人、事、物聚在一起,将整个网络切分为无数片段。互联网本来的样子是开放的,可它却会让我们走向局限。
那么,如何避免被“隔离”呢?最简单的一个小方法是使用一款不记录用户信息的搜索引擎。如果你在平时搜索浏览时,搜索引擎不记录你的IP地址,无法分析到你的位置,不记录你的搜索关键词,就无法分析出你感兴趣的领域、职业等等,这就在一定程度上避免了被定制的可能性。在这里推荐一款搜索引擎,秘迹搜索 mijisou.com
上一篇:时间到底是什么?为什么感觉一天一天时间过的很慢,而一年又一年时间过的却又飞快?
下一篇:返回列表
相关链接 |
||
网友回复(共有 0 条回复) |