二次函数拟合——最小二乘法公式法 与线性回归相似,对二次函数进行拟合某种意义上也只是加了一个函数,虽然求解的方程变得更加繁琐,需要准备的变量也增加到了七个。 思路有借鉴于:最小二乘法拟合二次曲线 C语言 为了更好的理解回归问题中最小二乘法的求偏导过程,这次我选择自己手打公式。 大概流程如下
但是到此处之后便被这三个繁琐的方程给难倒了,虽然肯定可以说是能强解,但是感觉就是不断地消元,还是在大量系数的情况下,于是我查找了资料,自然万能的python库是无所不能的,解三元一次方程这种小事当然轻松——sympy库 这个库简直是神器,我主要运用了一下几个功能
声明变量
毕竟出现在方程中的未知数是未定义的,一般情况下是不能允许定义前的运算,可以说这是解方程的基础。
解方程
f1=((s1-b1*s2-b2*s3)/100)-b0 f2=((s4-b0*s2-b2*s5)/s3)-b1 f3=((s6-b0*s3-b1*s5)/s7)-b2 result=sp.solve([f1,f2,f3],[b0,b1,b2])
或
sp.solve([((s1-b1*s2-b2*s3)/100)-b0,((s4-b0*s2-b2*s5)/s3)-b1,((s6-b0*s3-b1*s5)/s7)-b2],[b0,b1,b2])
然而此处出现了一个巨大的坑,那就是,最终如果这样输出
print(sp.solve([f1,f2,f3],[b0,b1,b2])) 结果便是
{b0: 5.54334244651814, b1: 0.458746450400443, b2: 0.960930395945233} 一开始我没有意识到,直到运行时满屏幕红字报错,其中最主要的一句话
TypeError: can't convert expression to float 我当时就纳了闷了,print结果好好的,都是float,怎么还不行? 后来不断查阅网上相关博客,直到 使用python的sympy解符号方程组后,如何将结果带入之后的符号表达式 真的是,一语点醒梦中人。 solve得出的解并不是完好的存在了之前“声明”的变量中,严格意义上来讲,是存储在了一个词典中。他的索引是那个变量名。也就是说,我们把变量名当成了字符形式,真正意义上只是个摆设,表示未知量却不存储最终结果,看到这里真是又兴奋有懊悔,或许是我对python的特殊数据类型不熟悉吧。也因此最终用了以下函数解决
plt.plot()函数也遇到了这个问题,不过也解决了。 至此呈上结果图
或许这就是完成一个小工程的喜悦吧。
完整代码如下(留有过去删改及笔记):
import matplotlib.pyplot as plt workbook=xlrd.open_workbook(r'6.xls') sheet=workbook.sheet_by_index(0) cols1=sheet.col_values(0) #获取第一列 cols2=sheet.col_values(1) #获取第二列 s5=s5+cols1[i]*cols1[i]*cols1[i] s6=s6+cols1[i]*cols1[i]*cols2[i] s7=s7+cols1[i]*cols1[i]*cols1[i]*cols1[i] f1=((s1-b1*s2-b2*s3)/100)-b0 f2=((s4-b0*s2-b2*s5)/s3)-b1 f3=((s6-b0*s3-b1*s5)/s7)-b2 result=sp.solve([f1,f2,f3],[b0,b1,b2]) #{b0: 5.54334244651814, b1: 0.458746450400443, b2: 0.960930395945233} #sp.solve([((s1-b1*s2-b2*s3)/100)-b0,((s4-b0*s2-b2*s5)/s3)-b1,((s6-b0*s3-b1*s5)/s7)-b2],[b0,b1,b2]) plt.scatter(cols1,cols2,color = 'blue') plt.plot(x,y,color="red")
|