您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识
天下无贼主题曲(知识图谱在小米的应用与探索)
实体,图谱,小米天下无贼主题曲(知识图谱在小米的应用与探索)
发布时间:2019-02-08加入收藏来源:互联网点击:
分享嘉宾:彭力 小米
编辑整理:马瑶
出品平台:DataFunTalk
出处:https://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247512032&idx=1&sn=4b3b9b13b88c9f88dddc676e2134ebac
导读: 小米知识图谱于2017年创立,已支持公司了每天亿级得访问,已赋能小爱同学,小米又品、智能问答、用户画像、虚拟助手、智能客服等互联网产品。 通过引入知识图谱,这些产品在内容理解、用户理解、实体推荐等方面都有了显著的效果提升。 本文的主要内容包括:
小米知识图谱介绍:包括小米的商业模式、小米人工智能部、知识图谱在人工智能部的定位、小米知识图谱的发展历程、以及小米知识图谱的落地场景。小米知识图谱关键技术:小米知识图谱在成长过程中的技术积累。小米行业知识图谱探索:结合业务,跟大家分享下小米在行业图谱上的探索。01
小米知识图谱介绍
1. 小米知识图谱介绍在了解小米知识图谱之前,先介绍下小米的商业模式。小米在商业模式上提出硬件 新零售 互联网铁人三项的商业模式。这种商业模式下有像手机、小米音箱类的智能硬件;有米商城,有品电商这样的新零售;还有像人工智能这样的互联网服务。三者相扶相持,相互促进,是一种闭环的生态模式,在这种生态模式下,有很多潜在的应用场景,对人工智能,对内容和知识有很多诉求。
小米人工智能部已经构建了完整的中台体系,囊括了视觉、NLP、知识图谱、语音、深度学习等底层的基础能力,其中知识图谱就处于这一层。
中间层是问答服务、智能客服等应用能力层,上层是小爱同学、商城等互联网业务和传统业务层,这些都是知识图谱的落地场景,其中小爱同学是小米公司推出的虚拟人工的智能助理,小爱同学适用于手机、音响、电视、手表以及手环等穿戴设备,通过搭载小爱同学的智能硬件,可以满足用户获取知识和信息的需求。
小米知识图谱在中台体系下不断地成长,2017年小米知识图谱有了一些开放知识的积累, 2018年知识图谱团队成立,2018年底,通用知识图谱的构建,百科类图谱构建完成,2019年中,业务拓展,线上调用达到近亿次,2019年底,知识扩增,知识积累了超三百亿,2020年行业探索,行业图谱落地。虽然发展的比较晚,但是在自己的业务场景下,发展还算迅速。
小米知识图谱在公司的职责,主要是研究开放领域和行业领域的构建和应用技术,并把图谱推广到相关业务场景上,来提高用户的满意度的和业务变现转化能力。团队已构建超三百亿开放知识和涉及13个领域。除此之外,小米还参与了一些开放知识图谱的构建,是OpenKG之OpenBase子项目组主要成员单位,是IEEE知识图谱国家标准编制组主要成员。
小米知识图谱已经已经赋能公司10 个业务场景,这些落地场景包括智能问答、智能客服、小爱同学、虚拟助手、全局搜索、NLP等这样通用的知识领域。还有像游戏中心、广告,小米有品,小米网等这样的行业知识,下面我会重点介绍一下具体场景的细节。
2. 应用场景:智能问答第一个是小米知识图谱在智能问答场景的应用,这个比较广泛,落地的设备较多,已服务于手机、音响、智能穿戴、智能车载、电视、儿童设备。应用于小爱音响、小爱同学、小寻手表、车载设备等,满足用户近亿次/天的请求,后面我们介绍落地场景的示例。
目前,智能问答包括两种模式:一种是一般问答模式,还有一种是规则推理的。一般问答场景下,在返回具体答案的同时,还会把关联实体的附加信息满足给用户,比如用户询问巩俐的籍贯的时候,返回答案不只是会返回山东济南,还会把问答实体巩俐的视频,人物关系,资讯新闻,代表作品等都呈现给用户,这样在用户兴趣激发上起到了很大作用。另外一个古诗词CASE,也能很好地体现这一点,比如用户问静夜思的作者是谁,用户除了想得到这首诗的作者外,可能还想温故这首诗,也可能想要了解这首诗的释义。所以我们会把有声资源、释义一并满足给用户。
最后,问答在歧义场景下还支持列表形式展现。
除了一般的问答方式以外,小米还支持推理的问答。比如:多条件推理,多跳关系推理,还支持像求最大值,最小值这种基础推理算子。多条件推理的例子如:山东籍的双子座是谁,首先会对数据库中人物实体的生日推理出星座是双子座,然后推出省份,最后筛选聚合产出实体结果 ,第二种是多跳关系推理,比较典型的就是人物与人物的六度关系推理,如:徐志摩与梁思成的儿子梁从诫是什么关系?我们会试图计算起始实体到目标实体的关系的最短可达路径呈现给用户。现有的推理逻方法,比如说基于规则的推理、基于模型的推理,规则推理主要包含规则引擎和一阶的逻辑规则。模型推理是用机器学习去表示学习关系推理。所以这里根据自己的需求、应用场景和应用情况去选择。
后面介绍一些基于智能问答的一些方法。基于图谱的智能问答,通用流程如下:语音识别环节,意图识别,实体匹配,实体查询返回结果。
举个例子,如武汉大学周边什么好吃的,首先做分词或者词法分析,分出武汉大学和好吃的这些关键mention,然后意图识别计算得到是美食需求的,第三步是实体识别,把mention武汉大学映射到知识图谱中的实体上,把属性好吃映射成推荐食物,最后实体查询计算,返回热干面,武昌鱼,豆皮,油焖大虾。
小米基于知识问答有很多方法,第一种是基于模版的方法,它的大体流程是这样的:
第一步对query做实体链接(实体链接技术在第二部分会详细介绍),第二步把实体名用实体链接后的主实体对应的实体类型替换后去离线的模板库匹配,返回模板库中映射后的归一的模版,最后查询实体库返回答案。
举个例子:
姚明的老婆是谁,第一步先做实体链接,后面把姚明的实体类型人物替换姚明,去人物垂域模板规则库查询模板,发现命中了lambda_x.配偶这个模板。最后在图谱数据国查询姚明的配偶,返回答案叶莉。这种方法有一个好处就是准确率比较好,是离线挖掘的模板,所以性能也比较好,但是缺点也比较明显泛化能力差。其中模板的挖掘方法的话,主要是离线从知识图谱中实体中找目标实体对,然后去问答论坛去匹配问题与答案分别出现的pair,生成模板的pair,这么做会有很多噪声需要做进一步过滤,比如:需要过滤掉出现多属性的问答对的情况和频次出现比较低的情况。
为了解决第一种方法泛化性能比较差的问题,用第二种方式基于槽填充的方式来互补。第一种方法在李白有哪些诗的时候,可以命中模版库满足用户的需求。但是变成李白有名的诗有哪些时,就无法找到答案了。为了解决这种问题,我们用了槽填充和意图识别联合学习的方法方法,借鉴了2016年liu的基于attention的意图检测和插槽填充联合学习的的方法。该方法把槽填充与意图识别联合的学习,方法包含两部分槽填充和意图识别,两部分组成,第一部分是槽填充问题转化为序列标注的NER问题,第二步是意图识别,把意图识别转换为文本分类问题。最后把两个问题整合做一个联合学习。PPT右下角已给出论文和代码。该方法在部分垂哉上的召回的提升比较明显。在菜谱,古诗垂域上欠召回的badcase解决率为30%
上一篇:给狗狗起名字大全(毛茸茸的宠物狗名字大全且拥有力量-可爱点)
下一篇:返回列表
相关链接 |
||
网友回复(共有 0 条回复) |