درخت تصمیم گیری از تصمیمات قبلی شما برای محاسبه شانس شما استفاده می کند تا بخواهید ببینید.
کمدین یا نه.
اجازه دهید جنبه های مختلف درخت تصمیم را بخوانیم:
رتبه <= 6.5
به این معنی است که هر کمدین با رتبه 6.5 یا
پایین تر به دنبال خواهد داشت
فلش درست
(در سمت چپ) و بقیه
پیکان نادرست
(در سمت راست) را دنبال کنید.
gini = 0.497
به کیفیت
تقسیم می شود و همیشه عددی بین 0.0 و 0.5 است که 0.0 به معنای همه
نمونه ها همان نتیجه را گرفتند و 0.5 به این معنی است که تقسیم انجام شده است
دقیقاً در وسط.
samples = 13
به این معنی است که 13 مورد وجود دارد
کمدین ها در این مرحله تصمیم را ترک کردند، که همه آنها از این نظر هستند
مرحله اول.
value = [6, 7]
به این معنی است که از این 13 مورد
کمدین ها، 6 نفر "نه" و 7 نفر یک "نه" دریافت می کنند
"GO".
راههای زیادی برای تقسیم نمونهها وجود دارد، ما در این آموزش از روش GINI استفاده میکنیم.
روش جینی از این فرمول استفاده می کند:
Gini = 1 - (x/n)2 (y/n)2
جایی که x
تعداد پاسخهای مثبت است ("GO")،n
تعداد نمونهها وy
تعداد پاسخهای منفی است ("NO")،
که این محاسبه را به ما می دهد:
1 - (7 / 13)2 - (6 / 13)2 = 0.497
p>
مرحله بعدی شامل دو کادر است، یک کادر برای کمدینها با 'رتبه'
6.5 یا کمتر، و یک جعبه با بقیه.
gini = 0.0
به این معنی است که همه نمونه ها
نتیجه مشابه.
samples = 5
به این معنی است که 5 کمدین وجود دارد
در این شاخه (5 کمدین با رتبه 6.5 یا پایین تر).
value = [5, 0]
به این معنی است که 5 یک "NO" دریافت می کند
و 0 یک "GO" دریافت می کند.
ملیت <= 0.5
به این معنی است که کمدین ها
با مقدار ملیت کمتر از 0.5 پیکان سمت چپ را دنبال می کند
(یعنی همه افراد از بریتانیا، ) و بقیه پیکان را دنبال می کنند
درست است.
gini = 0.219
به این معنی است که حدود 22٪ از
نمونه ها در یک جهت خواهند رفت.
samples = 8
به این معنی است که 8 کمدین وجود دارد
در این شاخه (8 کمدین با رتبه بالاتر از 6.5).
value = [1, 7]
به این معنی است که از این 8 مورد
کمدین ها، 1 "NO" و 7 "GO" دریافت می کند.
سن <= 35.5
به این معنی است که کمدین ها
در سن 35.5 یا کمتر، فلش را به سمت چپ دنبال می کنند و بقیه پیکان را به سمت چپ دنبال می کنند.
درست است.
gini = 0.375
به این معنی است که حدود 37.5٪ از
نمونه ها در یک جهت خواهند رفت.
samples = 4
به این معنی است که 4 کمدین وجود دارد
در این شاخه (4 کمدین از بریتانیا) باقی مانده است.
value = [1, 3]
به این معنی است که از این 4 مورد
کمدین ها، 1 "NO" و 3 "GO" دریافت می کند.
gini = 0.0
به این معنی است که همه نمونه ها
نتیجه مشابه.
samples = 4
به این معنی است که 4 کمدین وجود دارد
در این شاخه باقی مانده است (4 کمدین نه از بریتانیا).
value = [0, 4]
به این معنی است که از این 4 مورد
کمدین ها، 0 "NO" و 4 "GO" دریافت می کنند.
gini = 0.0
به این معنی است که همه نمونه ها
نتیجه مشابه.
samples = 2
به این معنی است که 2 کمدین وجود دارد
در این شاخه باقی مانده است (2 کمدین در سن 35.5 سال یا کمتر).
value = [0, 2]
به این معنی است که از این 2 مورد
کمدین ها، 0 "NO" و 2 "GO" دریافت می کنند.
تجربه <= 9.5
به این معنی است که کمدین ها
با 9.5 سال تجربه یا بیشتر، فلش سمت چپ را دنبال می کند و بقیه پیکان را دنبال می کنند
درست است.
gini = 0.5
به این معنی است که 50٪ از نمونه ها
در یک جهت خواهد رفت.
samples = 2
به این معنی است که 2 کمدین وجود دارد
در این شاخه باقی مانده است (2 کمدین بزرگتر از 35.5 سال).
value = [1, 1]
به این معنی است که از این 2 مورد
کمدین ها، 1 "NO" و 1 "GO" دریافت می کند.
gini = 0.0
به این معنی است که همه نمونه ها
نتیجه مشابه.
samples = 1
به این معنی است که 1 کمدین وجود دارد
در این شاخه باقی مانده است (1 کمدین با 9.5 سال سابقه یا کمتر).
value = [0, 1]
به این معنی است که 0 یک "NO" دریافت می کند و
1 یک "GO" دریافت می کند.
gini = 0.0
به این معنی است که همه نمونه ها
نتیجه مشابه.
samples = 1
به این معنی است که 1 کمدین وجود دارد
در این شاخه باقی مانده است (1 کمدین با بیش از 9.5 سال سابقه).
value = [1, 0]
به این معنی است که 1 یک "NO" دریافت می کند و
0 یک "GO" دریافت می کند.