توزیع تصادفی داده ها(Random Data Distributions)

در یادگیری ماشینی، مجموعه داده‌ها می‌توانند شامل هزاران یا حتی میلیون‌ها مقدار باشند.


شما ممکن است هنگام آزمایش یک الگوریتم، داده های دنیای واقعی نداشته باشید
ممکن است مجبور به استفاده از مقادیر تصادفی تولید شده باشد.



همانطور که در فصل قبل آموختیم، ماژول NumPy می تواند در این زمینه به ما کمک کند!


اجازه دهید دو آرایه ایجاد کنیم که هر دو با 1000 عدد تصادفی از یک
توزیع عادی داده.


آرایه اول دارای میانگین 5.0 با انحراف استاندارد خواهد بود
1.0.


آرایه دوم با یک استاندارد میانگین 10.0 خواهد داشت
انحراف 2.0:




مثال


A scatter plot with 1000 dots:



import numpy
import matplotlib.pyplot as plt

x = numpy.random.normal(5.0,
1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)

plt.scatter(x, y)

plt.show()


Result:







نقشه پراکندگی توضیح داده شد



می‌توانیم ببینیم که نقاط حول مقدار 5 در محور x متمرکز شده‌اند،
و 10 در محور y.


همچنین می‌توانیم ببینیم که گسترش در محور y بیشتر از محور x است.