Einsendeaufgaben EA-Besprechung | 32711 | SS 2019 | EA1 42200 | 06.06.2019

Und im zweiten Schritt ist die HPV und die LV ein Endknoten, da die Verunreinigung jeweils = 0 ist (alle sind entweder interessiert oder nicht an einer Rechtsschutzversicherung).
Der Knoten HRV ist jedoch kein Endknoten. Bei der Berechnung des neuen Durchschnittsalters ergeben sich 45,25 Jahre, also ca. 45 Jahre.
Entsprechend ergibt sich:
{Alter}Impurity = 1/2 x 1/2 + 1/2 x 1/2 = 1/2 (da jeweils die ü und u 45 jährigen einmal interessiert sind und einmal nicht)
{Geschlecht}Impurity = 1/2 x 0 + 1/2 x 0 = 0 (da die weiblichen jeweils interessiert sind und die männlichen nicht ist dies die geringste Verunreinigung mit der impurity = 0)

Entsprechend würde ich aufteilen in vorhandene Versicherungen und dann auf der Kante HRV noch einmal nach Geschlecht. Als Endknoten würden sich also ergeben LV, HPV und unter HRV je männlich und weiblich...

Oder habe ich grade einen Denkfehler?
 
Ich habe die gleiche Lösung wie @Fossil1992, jedoch mit anderen Begründungen.

Im ersten Schritt werden die Daten in der Tabelle analysiert, um das erste Attribut zu Identifizieren, dass aufgespaltet werden soll. Dabei fällt das Attribut Geschlecht in das Auge. Es gibt 6 männliche und 6 weibliche Personen und somit eine Gewichtung von jeweils 1/2. Innerhalb dieser Partition fällt auf, dass 4 weibliche Personen ein Interesse an der Rechtschutzversicherung haben und bei den Männern nur 2. Somit ist da der Gewichtungsfaktor 2/3 bei den weiblichen und 1/3 bei den männlichen Personen. Somit ist die gewichtete Gesamt-Impurity 1/2*1/3+1/2*2/3=1/2. Das ist aber schon die Impurty der Datenbasis gewesen. Genau so verhält es sich mit dem Attribut Alter. Der Durchschnitt liegt hier bei 40 und die hälfte ist älter und die andere Hälfte jünger als 40. Auch hier lässt sich kein Zusammenhang mit Alter und Produktinteresse herleiten. Die gewichtete Gesamt-Impurity wäre in diesem Fall 1/2*1/2+1/2*2/2=1/2. Somit kommt bei der Attributauswahl nur das Attribut „Bereits vorhandene Versicherung“ in Frage. Der Wertebereich des Attributs hat drei Elemente: Haftpflichtversicherung (HPV), Lebensversicherung (LV) und Hausratversicherung (HRV). Diese sind unter den Personen gleichmäßig verteilt. Damit ist die Gewichtung von jeder dieser Versicherungen 1/3. Hier fällt jedoch auf, dass alle, die eine HPV haben auch ein Interesse an der Rechtschutzversicherung (RSV) haben. Die Impurity dieser Partition ist somit 0. Ähnlich verhält es sich mit den Personen, die eine LV haben. Mit dem Unterschied, dass diese kein Interesse an einer RSV haben. Auch hier ist die Impurity gleich 0. Somit ist die Gesamt-Impurity in diesem Fall 1/3*0+1/3*0+1/3*1/2=1/6. Dies bedeutet den Größten Gewinn.
t1 wird also in drei Folgeknoten aufgeteilt.

Jetzt erfolgt die Überprüfung des Abbruchkriteriums. Für die Knoten t2 und t3 ist, wie oben beschrieben, die Impturity = 0 und somit das Abbruchkriterium erfüllt. Somit gehört der Knoten T2 zur Partition der Interessierten Bja und der Knoten t3 zur Partition der Nicht-Interessierten Bnein.

Jetzt erfolgt die erneute Anwendung der ersten beiden Schritte, auf die Knoten deren Impturity ungleich 0 ist. In diesem Fall der Knoten t4. Das Durchschnittsalter der übrigen Personen liegt bei 45,25 Jahren. Hier ist wieder eine gleiche Verteilung der Personen vorhanden. Somit ist die Gewichtung erneut 1/2 für das Attribut Alter. Das Produktinteresse der Älteren und Jüngeren verteilt sich ebenfalls auf 1/2. Somit ergibt sich für das Attribut eine Gesamt-Imptuity von 1/2* 1/2+ 1/2* 1/2=1/2. Das Attribut der bereits vorhandenen Versicherungen muss nicht mit betrachtet werden, da es aus der Trainingsmenge herausgefallen ist. Somit bleibt nur noch das Attribut der Geschlechter. Die Gewichtung hier für beträgt für die männlichen und weiblichen 1/2. Es fällt jedoch auf, dass die Weiblichen sich für die RSV interessieren und die männlichen Personen nicht. Somit ergbit dies eine Gesamt-Imptuity von 1/2*0+ 1/2*0=0. Somit sind die entstehenden Knoten t5 und t6 Endknoten.

Auf Pruning soll in dieser Aufgabe vollständig verzichtet werden.

Ich bin auf euer Feedback gespannt.
 
Hi,
hat jemand zufällig noch die PDF (also inkl. aller Aufgaben) der EA? :)

Grüße
 
Zurück
Oben