Schlaganfall-Analyse mit Machine-Learning

Analyse und Schlaganfall-Risikoberechnung mit Patientendaten, unter anderem Bluthochdruck, Herzerkrankung, Blutzuckerspiegel. Angefangen mit Linearer Regression, bis hin zu einem Neuronalen Netz

Von Burkhardt Röper

Der Schlaganfall gehört zu den Herz-Kreislauf-Erkrankungen, die in der westlichen Welt etwa die Hälfte aller Todesfälle verursachen. Wenn ein Schlaganfall auftritt, ist schnelles Handeln wichtig. In einem Notfall zählt jede Minute. Es gibt mehrere Faktoren, die einen Schlaganfall auslösen können, darunter Bluthochdruck und ein hoher Blutzuckerspiegel. In meiner Arbeit als Medizinjournalist habe ich immer wieder über sie geschrieben. Hier möchte ich mit Daten belegen, dass Schlaganfallfaktoren tatsächlich das Risiko erhöhen.

Analytischer Ansatz

Allein durch die Visualisierung sollte es möglich sein, Korrelationen zu erkennen. Weiterhin sollen Modelle erstellt werden, um das Risiko eines Schlaganfalls zu bestimmen. Ich beginne mit einfachen linearen Regressionen und ende mit neuronalen Netzen. Letzteres ist vielleicht zu viel Aufwand. Aber es kostet sozusagen nichts.

Alle Analysen fallen unter die Kategorie des überwachten Lernens.

Algorithmus-Auswahl

Einige Gedanken zu den Algorithmen: Man kann einige lineare Korrelationen erwarten, z.B. BMI, Zuckerwerte, Alter, etc. Auch einige Merkmale sollten gut für die logistische Klassifikation sein, z.B. die Merkmale Geschlecht, Bluthochdruck, Herzkrankheit, die wahr oder falsch sind. Andere Klassifikationen wie K-Means sollen nicht fehlen. Entscheidungsbäume sollten ausprobiert werden.

Dies ist also der Ansatz: Zuerst alle Features zusammen ausprobieren und sehen, was passiert. Dann greife ich die Features heraus, die für die lineare Regression gut sind und vergleiche sie mit dem Alle-Features-Ergebnis. Zum Schluss probiere ich ein neuronales Netzwerk aus.

Ergebnisse

Die Ergebnisse der ML-Methoden waren fast identisch - und ziemlich gut. Der Gewinner wäre die polynomiale Regression, da diese am schnellsten sein sollte.

Das Ergebnis des Neuronalen Netz ist fast identisch mit den anderen Modellen oben. Wie erwartet, hat das Einrichten eines neuronalen Netzwerks die Ergebnisse nicht verbessert. Da neuronale Netzwerke zeit- und ressourcenaufwändiger sind, lohnt es sich nicht.

Ich konnte zeigen, dass Schlaganfallfaktoren tatsächlich das Risiko erhöhen. Ich bin nicht mehr als Gesundheitsjournalist tätig. Aber sehr froh, dass all das, was ich in der Vergangenheit geschrieben habe, tatsächlich wahr ist. Ich habe ja auch nichts anderes erwartet. Was ich in der Vergangenheit geschrieben habe, waren nicht meine eigenen Gedanken, sondern die Infos von Ärzten und anderen Experten. Und deren Aussagen basierten auch auf Daten - natürlich. Daten sind wichtig!

Klick: Komplette Arbeit auf meinem GitHub-Account