您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识
poi是什么(地图POI类别标签体系建设实践)
样本,标签,文本poi是什么(地图POI类别标签体系建设实践)
发布时间:2019-02-08加入收藏来源:互联网点击:
总体上经过以上textCNN的业务改造与迭代,随机数据准确率提升5%以上,同时业务规则减少66%,同时在长尾case(低频文本、品牌)上取得比较明显的效果。
相关工作
前面主要介绍了我们在类别标签建设方面的一些工作。
在另一方面,类别标签在地图搜索中生效,则需要识别哪些query需要使用标签进行召回。在前期,我们人工标注了高德地图搜索头部query和标签的对应关系。但人工的标注方式始终覆盖有限:
不能取得中低频query的标签召回收益,从而标签利用率不够高;对于应该使用标签召回的query,如果因为未能识别而使用文本召回,也影响了线上的效果,降低用户体验,造成badcase。因此,在完成体系建设后,我们另外建模,主要使用文本语义和点击方面的特征,识别query和标签的对应召回关系,即识别哪些query可以使用类别标签召回,通过这一系列的工作,对中低频的标签召回进行了深挖,高德地图中类别搜索流量中使用标签召回比例高达94%。
收益标签数据产出后,需要进行两方面的评估:
从输出数据的质量上,即本身标签的准确率和覆盖率:高质量的数据,不光利于搜索的业务支撑,还利于我们的类别标签体系在整个BU的推广和落地。
上线后对线上泛搜实际query的搜索效果提升评估:除了数据质量的评估,还会结合新的标签数据对搜索效果进行评估,即对新标签体系和旧标签体系的对照效果评估。在人工效果评估中,gsb效果上,每个大类的数据上线,都带来了非常明显的类别搜索质量提升,从而让搜索更准确、更全面的辅助用户决策。
小结当前工作的重点在于使用通用特征解决了主体的类别打标问题,对于通用特征不可解的问题,往往通过外部知识、资源的建设方式解决,如品牌库建设、A级景区资源收集等方式。
而实际上,使用通用特征外,不通用特征对于部分数据的分类效果提升应用并不充分,后续应该安排一系列的专项优化,比如:
评论、简介等特征,应用一些Attention方法,可能取得比较好的补充效果;POI图片中往往隐含一些类别相关信息,对图片识别可以充分利用这些信息;外部百科、知识图谱等知识的引入,辅助中低频品牌库的建设等。在业务闭环建设上还要持续,比如恶劣case的流转与自动修复机制建设,新品牌、新标签的发现等问题,以避免打标系统长期运行后的效果退化等。
无论机器学习还是外部资源辅助的方式,对于海量的长尾数据往往乏力,实际线上很多的POI特征相当匮乏,只有一个简单的名称,从中很难准确预测其类别。如何引导用户自己提交类别信息,或者众包方式完成类别标签的标注,也是我们后续需要着重考虑的解决方案。
作者:高德技术小哥
本文到此结束,希望对大家有所帮助呢。
上一篇:郑渊洁作品(郑渊洁在三十多年前就写出了《异次元杀阵》,成为80后的梦魇)
下一篇:返回列表
相关链接 |
||
网友回复(共有 0 条回复) |