در پایتون ماژول هایی داریم که کار را برای ما انجام می دهند. با وارد کردن شروع کنید
ماژول پانداها.
import Pandas
ماژول Pandas به ما امکان میدهد فایلهای csv را بخوانیم و یک شی DataFrame را برگردانیم.
df = pandas.read_csv("cars.csv")
سپس فهرستی از مقادیر مستقل تهیه کنید و آن را فراخوانی کنید
متغیر X
.
مقادیر وابسته را در متغیری به نام y
قرار دهید.
X = df[['Weight', 'Volume']]
y = df['CO2']
نکته: معمولاً نامگذاری لیست مقادیر مستقل با علامت بالایی وجود دارد
مورد X و لیستی از مقادیر وابسته با حروف کوچک y.
ما از چند روش از ماژول sklea
استفاده خواهیم کرد، بنابراین باید آن ماژول را نیز وارد کنیم:
from sklea
import linear_model
از ماژول sklea
ما از روش LinearRegression()
استفاده خواهیم کرد
برای ایجاد یک شی رگرسیون خطی.
این شی دارای متدی به نام fit()
است که طول می کشد
مقادیر مستقل و وابسته را به عنوان پارامتر تعیین می کند و شی رگرسیون را با داده هایی پر می کند که رابطه را توصیف می کند:
regr = linear_model.LinearRegression()
regr.fit(X, y)
اکنون یک شی رگرسیون داریم که آماده پیش بینی مقادیر CO2 بر اساس آن است
وزن و حجم خودرو:
#predict the CO2 emission of a car where the weight
is 2300g, and the volume is 1300ccm:
predictedCO2 = regr.predict([[2300, 1300]])
See the whole example in action:
[107.2087328]
ما پیشبینی کردهایم که خودرویی با موتور 1.3 لیتری و وزن 2.3 کیلوگرم، تقریباً 107 گرم CO2 در هر
کیلومتر آن را می گذراند.