博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
衡量线性回归法的指标MSE, RMSE,MAE和R Square
阅读量:5932 次
发布时间:2019-06-19

本文共 1021 字,大约阅读时间需要 3 分钟。

衡量线性回归法的指标:MSE, RMSE和MAE

举个栗子:

对于简单线性回归,目标是找到a,b 使得尽可能小

其实相当于是对训练数据集而言的,即

当我们找到a,b后,对于测试数据集而言

,理所当然,其衡量标准可以是

但问题是,这个衡量标准和m相关。

(当10000个样本误差累积是100,而1000个样本误差累积却达到了80,虽然80<100,但我们却不能说第二个模型优于第一个)

改进==> 对式子除以m,使得其与测试样本m无关

 -> 

 但又有一个问题,之前算这个公式时为了保证其每项为正,且可导(所以没用绝对值的表示方法),我们对式子加了一个平方。但这可能会导致量纲的问题,如房子价格为万元,平方后就成了万元的平方。

又改进==> 对MSE开方,使量纲相同

->

 MSE与RMSE的区别仅在于对量纲是否敏感

 又一思路,通过加绝对值

 -> 

在推导a,b的式子时(对train数据集),没用求绝对值的方法是因为其不是处处可导,不方便用来求极值。但评价模型时,对test数据集我们完全可以使用求绝对值的方式。

 P.S. 评价模型的标准和训练模型时最优化的目标函数是可以完全不一样的。

RMSE vs MAE 

RMSE 与 MAE 的量纲相同,但求出结果后我们会发现RMSE比MAE的要大一些。

这是因为RMSE是先对误差进行平方的累加后再开方,它其实是放大了较大误差之间的差距。

而MAE反应的就是真实误差。因此在衡量中使RMSE的值越小其意义越大,因为它的值能反映其最大误差也是比较小的。

衡量线性回归法最好的指标 R Squared

对于上述的衡量方法,如RMSE和MAE还是有问题的,还是因为量纲不一样。比如我们预测考试分数误差是10,预测房价误差是1w。但我们却不能评价我们的模型是更适合预测分数还是预测房价。

解决方法==> 新的指标:R方

(上:y预测-y真,our model,下:y真平均-y真,baseline model)

 使用baseline模型肯定会产生很多错误,我们自己的模型产生的错误会少一些。

1 - ourModelError / baselineModelError = 我们模型拟合住的部分

 R方将回归结果归约到了0~1间,允许我们对不同问题的预测结果进行比对了。

我们可发现,上面其实就是MSE,下面就是方差

 

转载于:https://www.cnblogs.com/zzzzy/p/8490662.html

你可能感兴趣的文章
测试人员必学的软件快速测试方法(二)
查看>>
程序员全国不同地区,微信(面试 招聘)群。
查看>>
【干货】界面控件DevExtreme视频教程大汇总!
查看>>
闭包 !if(){}.call()
查看>>
python MySQLdb安装和使用
查看>>
Java小细节
查看>>
poj - 1860 Currency Exchange
查看>>
chgrp命令
查看>>
Java集合框架GS Collections具体解释
查看>>
洛谷 P2486 BZOJ 2243 [SDOI2011]染色
查看>>
linux 笔记本的温度提示
查看>>
数值积分中的辛普森方法及其误差估计
查看>>
Web service (一) 原理和项目开发实战
查看>>
跑带宽度多少合适_跑步机选购跑带要多宽,你的身体早就告诉你了
查看>>
广平县北方计算机第一届PS设计大赛
查看>>
深入理解Java的接口和抽象类
查看>>
java与xml
查看>>
Javascript异步数据的同步处理方法
查看>>
快速排序——Java
查看>>
iis6 zencart1.39 伪静态规则
查看>>