绵羊汽车生活记录 sheep汽车资讯 针对车载终端数据项异常值的检测方法

针对车载终端数据项异常值的检测方法

跟着长途排放监控车载终端的进展和普及,重型货车的枢纽消息流数据不竭数字化、漫长化,为后续的囚系和判辨任务奠定了较好的根基。但为今朝终端囚系的进展程度处于低级阶段所限,消息流数据的质料方针不齐,限度了后续的囚系判辨任务。因而加紧消息流数据质料监控势正在必行。

现行的数据质料央浼总体上分为两种:1.缺失率;2.无效能。因为本文探究的是针对数据非常值检测的伎俩,因而上述两种伎俩本文不再赘述。现实正在车辆上传的报文数据中,缺失和无效的题目或许较好的举办识别,真正亟待处理的题目是若何断定数据是否非常。非常值平日会形成衡量差错或非常体系条款的结果,于是不具有形容底层体系的特性。现实上,最佳做法是正在判辨之前,就应当举办非常值去除统治。

这里的非常厉重有两层有趣:一、数据正在实际中是否合适逻辑,这方面的非常可能依赖营业逻辑举办鉴定,合适条例的属于平常,反之则诟谇常;二、数据分散中的噪声点,这种非常独立于营业逻辑,无法通过容易的条例举办鉴定,本文将着重先容针对此种非常举办检测的伎俩——四分位数法。

四分位数法又叫Tukey’s test,是统计学中成熟、利用较为普及的非常值检测伎俩。其策动的经过也许为:

3)策动下四分位数,这里树立为Q1,示意总数据最小的25%的数据正在这个点以下;策动上四分位数,树立为Q3,示意最大的25%数据都正在这个点以上。

4)寻找数据的“内围”。第一步是把四分位差乘以参数k,k凡是取值1.5。加上Q3 ,用Q1 减去这个和,获得内围。

这种假设数据合适正态分散的精确性难以获得确保,而四分位数法较于其他非常值检测的伎俩策动容易,但或许有用筛选数据中的离群点,适合大领域数据的策动;同时生动的参数树立可能针对不怜惜况、分别字段举办调整使得四分位数法或许有用的顺应众变的车辆报文数据。

汽车测试网-成立于2008年,报道汽车测试身手与产物、趋向、动态等 接洽邮箱 marketing#auto-testing.net (把#改成@)

本文来自网络,不代表绵羊汽车生活记录立场,转载请注明出处:http://car.shaomingyang.com/13296.html

作者: sheep

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

联系我们

13426325341

在线咨询: QQ交谈

邮箱: 2363400792@qq.com

工作时间:7*24小时全年无休
返回顶部