مجموعه داده را متناسب کنید(Fit the Data Set)

مجموعه داده چگونه به نظر می رسد؟ به نظر من فکر می کنم بهترین جا خواهد بود
یک رگرسیون چند جمله‌ای، بنابراین اجازه دهید خطی از رگرسیون چند جمله‌ای رسم کنیم.


برای ترسیم یک خط در میان نقاط داده، از استفاده می کنیم.
متد plot()
ماژول matplotlib:



مثال


Draw a polynomial regression line through the data points:



import numpy
import
matplotlib.pyplot as plt
numpy.random.seed(2)

x =
numpy.random.normal(3, 1, 100)
y = numpy.random.normal(150, 40, 100) / x


train_x = x[:80]
train_y = y[:80]

test_x = x[80:]
test_y =
y[80:]

mymodel = numpy.poly1d(numpy.polyfit(train_x, train_y, 4))


myline = numpy.linspace(0, 6, 100)

plt.scatter(train_x, train_y)

plt.plot(myline, mymodel(myline))
plt.show()

Result:








نتیجه می تواند پیشنهاد من را در مورد برازش مجموعه داده با یک چند جمله ای پشتیبانی کند
رگرسیون، حتی اگر بخواهیم پیش بینی کنیم، نتایج عجیبی به ما می دهد
مقادیر خارج از مجموعه داده مثال: خط نشان می دهد که یک مشتری است
صرف 6 دقیقه در مغازه می تواند خریدی به ارزش 200 دلار داشته باشد
نشانه ای از تناسب بیش از حد.


اما نمره R-squared چطور؟ امتیاز مربع R شاخص خوبی است
از اینکه مجموعه داده‌های من چقدر با مدل منطبق است.