您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识
iqr是什么意思(iqr是什么意思统计学)
数据,异常,据点iqr是什么意思(iqr是什么意思统计学)
发布时间:2020-12-06加入收藏来源:互联网点击:
「低」和「高」的定义取决于应用,但一般实践表明,超过平均分三个标准差的分数被认为是异常的。算法的细节可以在论文《Robust Random Cut Forest Based Anomaly Detection On Streams》里找到。
这个算法的优点在于它可以处理非常高维的数据。它还可以处理实时流数据(内置 AWS Kinesis Analytics)和离线数据。
作者在下面的视频中更详细地解释了这个概念:
https://youtu.be/yx1vf3uapX8
本文给出了与孤立森林相比的一些能基准。本文的研究结果表明,RCF 比孤立森林更准确、更快速。
完整的代码可以在这里找到:
https://github.com/awslabs/amazon-sagemaker-examples/tree/master/introduction_to_amazon_algorithms/random_cut_forest
结论
我们生活的世界里数据每秒钟都在增长。如果使用不当,数据会随着时间而贬值。在在线数据流或离线数据集中发现异常对于识别业务中的问题,主动构建解决方案以在问题发生之前发现问题,甚至在探索数据分析(EDA)阶段为 ML 准备数据集都至关重要。
原文链接:https://towardsdatascience.com/5-ways-to-detect-outliers-that-every-data-scientist-should-know-python-code-70a54335a623
本文到此结束,希望对大家有所帮助呢。
上一篇:货源归边(货源归边是什么意思)
下一篇:返回列表
相关链接 |
||
网友回复(共有 0 条回复) |