تناسب بد؟(Bad Fit?)

اجازه دهید مثالی ایجاد کنیم که در آن رگرسیون چند جمله ای بهترین روش نخواهد بود.
برای پیش بینی مقادیر آینده.




مثال


These values for the x- and y-axis should result in a very bad fit for
polynomial
regression:



import numpy
import matplotlib.pyplot as plt

x =
[89,43,36,36,95,10,66,34,38,20,26,29,48,64,6,5,36,66,72,40]
y =
[21,46,3,35,67,95,53,72,58,10,26,34,90,33,38,20,56,2,47,15]

mymodel =
numpy.poly1d(numpy.polyfit(x, y, 3))

myline = numpy.linspace(2, 95, 100)


plt.scatter(x, y)
plt.plot(myline, mymodel(myline))
plt.show()

Result:







و مقدار r-squared؟




مثال


You should get a very low r-squared value.



import numpy
from sklea
.metrics import r2_score

x =
[89,43,36,36,95,10,66,34,38,20,26,29,48,64,6,5,36,66,72,40]
y =
[21,46,3,35,67,95,53,72,58,10,26,34,90,33,38,20,56,2,47,15]

mymodel =
numpy.poly1d(numpy.polyfit(x, y, 3))

print(r2_score(y, mymodel(x)))






نتیجه: 0.00995 یک رابطه بسیار بد را نشان می دهد و به ما می گوید که این مجموعه داده برای رگرسیون چند جمله ای مناسب نیست.