مجموعه داده ها(Data Set)

در ذهن یک کامپیوتر، مجموعه داده هر مجموعه ای از داده است.
این می تواند هر چیزی از یک آرایه گرفته تا یک پایگاه داده کامل باشد.



نمونه آرایه:




[99,86,87,88,111,86,103,87,94,78,77,85,86]





نمونه ای از پایگاه داده:














































نام خودرورنگسنسرعتAutoPass
BMWقرمز599Y
Volvoمشکی786Y
VWخاکستری887N
VWسفید788Y
فوردسفید2111Y
VWسفید1786Y
تسلاقرمز2103Y
BMWمشکی987Y
ولووخاکستری494N
فوردسفید1178N
تویوتاخاکستری1277N
VWسفید985N
تویوتاآبی686Y


با نگاه کردن به آرایه، می توانیم حدس بزنیم که مقدار متوسط ​​احتمالاً حدود 80 است
یا 90، و همچنین می‌توانیم بالاترین مقدار و کمترین مقدار را تعیین کنیم، اما چه کار دیگری می‌توانیم انجام دهیم؟



و با نگاهی به پایگاه داده می توان دریافت که محبوب ترین رنگ سفید است و قدیمی ترین خودرو 17 سال است.
اما اگر بتوانیم فقط با نگاه کردن به مقادیر دیگر، پیش‌بینی کنیم که یک خودرو دارای AutoPass است چه می‌شود؟



یادگیری ماشینی برای همین است! تجزیه و تحلیل داده ها و پیش بینی نتیجه!




در یادگیری ماشینی کار با مجموعه داده های بسیار بزرگ رایج است. در این
ما سعی خواهیم کرد تا حد امکان درک آن را آسان کنیم
مفاهیم مختلف یادگیری ماشین، و ما با کوچک کار خواهیم کرد
مجموعه داده های قابل درک آسان.