ESD (Extreme Studentized Deviate) 数据异常值检测模型的原理是基于统计学中的"学生化残差"来进行异常值检测。模型会计算出每个数据点对应的学生化残差,然后对这些学生化残差进行统计分析,寻找其中的离群值。

具体的操作步骤如下:

  1. 对数据进行线性回归分析,计算出每个数据点的残差。
  2. 对残差进行标准化,得到学生化残差。
  3. 计算出每个学生化残差对应的统计量,如 Z-Score.
  4. 根据统计量对应的分布情况,设定置信度水平,确定哪些学生化残差是离群值。
  5. 将离群值对应的数据点标记为异常值。
Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐