Weizen & Spreu

Erinnert sich jemand noch an meinen Blog-Eintrag vom 6. Juli 2013, in dem ich anmerkte, daß sich am „Wohlfühlfaktor” irgendetwas geändert haben muß? Nein, die Frage ist nicht ernst gemeint – ich habe mich ja selbst kaum daran erinnert… 😉
Wenn man einen Arzt mit dem Thema Gefühl (genauer: Wohl- bzw. Unwohlfühlen) konfrontiert, findet man genervte Ignoranz, wo eigentlich doch ein interessiertes: „Was genau meinen Sie?” zu erwarten sein sollte. Wir haben nun mal kein Meßgerät fürs Wohlfühlen, sonst wär’s nämlich kein Gefühl. Doch dann bin ich beim Programmieren einer SVM auf einen merkwürdigen Einfall gekommen.

Lassen sich aus „verrauschten” Daten, die aufgrund der Nebenbedingungen als voneinander linear abhängig angesehen werden dürfen, Zuordnungen herausfiltern, zu welcher Funktion aus einem Set von Funktionen ein willkürlich herausgegriffener Datensatz gehört? Klingt kompliziert, ist es auch, wenn keine Vorgaben etwa zu einer „Soll”-Funktion vorliegen. Labeling_Bild1
Die Abbildung illustriert ein willkürliches Beispiel: es sind 200 Blutdruck-Meßpunkte (seit Nov. 2014) eingetragen, also jeweils Systol- und Diastol­wert.
Sicherlich ist ein linearer Zusammenhang naheliegend, aber es gibt keine anatomische Notwendigkeit, warum die Funktionsparameter nun gerade 1,0668 und 40,992 lauten müssen. Zudem erklärt der Wert der Diastole gerade einmal 50 % des zugehörigen Systolenwertes.
Es lassen sich formal – vorderhand ohne die Berücksichtigung anatomischer Gegebenheiten – durchaus bessere Werte als R²=0,5 erreichen. Bildlich gesprochen: es gibt eine „normale” (aber eben unbekannte) Abhängigkeit und es gibt eine „Störung”, für die ihrerseits lineare Abhängigkeiten angenommen werden. Der für die Suche der von derartigen Funktionen benötigte Algorithmus ist alles andere als trivial. Er soll, sonst würde es wohl den Rahmen sprengen, hier auch nicht dargelegt werden. Aber er sortiert in der Labeling_Bild2obigen Punktewolke die einzelnen Wertepaare und ordnet sie zwei linearen Funktionen zu – es wird R²=0,75 erreicht.
Ha! Das ist ja wohl keine Kunst, einfach ein paar Ausreißer der einen Funktion einer anderen zuzuordnen. Nicht so schnell. Man beachte das R² für die „Stör”-Funktion. Anderer Aspekt: Aus anatomisch-physiologischen Erwägungen heraus sollte für den Linearfaktor in der „Normal”-Funktion ein kleinerer Wert als Eins erwartet werden. Die Pumpleistung des Herzens spiegelt sich im absoluten Term (hier: 49,53 mm Hg; Abb. oben, grün) wider. Damit sollte aber die Systole um diesen Wert über der Diastole (und nicht etwa dem 1,0668-fachen davon) liegen, eher noch darunter (Reibungs­verluste, Viskosität, Elastizität etc.). Und Sys = 0,9653·Dias + 49,5 ist plausibler als die Ausgangsannahme (Abb. oben: Sys = 1,0668·Dias + 41,0).
Mit der letzten Abbildung schließt sich der Kreis; es ergibt sich nämlich vielleicht doch eine Möglichkeit, dem Gefühl des sich Fühlens durch simple Messung beizukommen. Dargestellt ist der zeitliche Verlauf der Blutdruck-Meßwerte sowie die Wahrscheinlichkeit pro Meßwert, daß er der „normalen” und nicht der „Stör”-Funktion zuzurechnen ist.Labeling_Bild3Im vorliegenden Beispiel gibt es keine Plateau-Phasen, die (ziemlich sicher) entweder durch die „normale” Funktion (Typ 1) oder die „Stör”-Funktion ausgezeichnet sind. In der überwiegenden Zahl der Fälle (≈70%) ist keine trennscharfe Zuordnung möglich, die Wahrscheinlichkeitsangaben (grüne Zappelkurve) liegen in der mittleren, grauen Zone. Die relativ sicheren Zuordnungen machen jeweils etwa 15% der Fälle aus. Das „riecht” schon sehr nach einer Gauß-Verteilung. Muß ja auch, denn der Ausgangs­datensatz hat seinerseits auch diese Charakteristik. Verblüffen darf es aber doch, daß die Zuordnungen, die aus einer Analyse der Datensätze ohne Berücksichtigung ihrer Zeit-Information stammen, im zeitlichen Ablauf Häufungen zeigen (vgl. Abb, geglättete Kurvenverläufe), die recht gut zu den protokollierten Befindlichkeits­angaben von damals „passen”. Was nun auch wieder – ich hör’s beinahe schon! – kein Wunder ist, denn der „Abgleich” von nicht eindeutigen Notizen mit numerischen Listen geschieht immer unter einem „zu positiv”-BIAS…

Advertisements

Über ausgesucht

…desillusioniert
Dieser Beitrag wurde unter abstrakt, Realität, Wissen, Zweifel abgelegt und mit , , , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

8 Antworten zu Weizen & Spreu

  1. lawgunsandfreedom schreibt:

    Entzückend! Auch, wenn ich der Meinung bin, daß das „wohlfühlen“ von viel zu vielen Faktoren abhängt, als daß man da einen zuverlässigen roten Faden finden könnte.

    Auf einzelne oder einige wenige Faktoren bezogen könnte so ein Programm allerdings gut funktionieren. (Mich würde noch interessieren, ob Deine Daten mit dem „Biorhythmus“ korrelieren könnten. Da der Biorhythmus eine eher esoterische Hypothese ist, hat das vermutlich noch nie jemand ernsthaft geprüft).

    • ausgesucht schreibt:

      … Du hast die Antithese ja gleich mit umrissen. Was ist denn eigentlich Biorhythmus? Was genau, definiert an objektivierbaren Daten? ❓

      Und was die vielen Wohlfühlfaktoren angeht: ich habe nicht vor (hatte es nie und werde es auch nie vorhaben), einen Wohlfühlindikator zu entwickeln. Ich habe eine SVM „erweitert”, um Basisfunktionen zu schätzen. Das obige Beispiel war lediglich eine Etüde am Morgen. Wobei mich in der Tat verblüfft hat, daß es womöglich eine Korrelation zu meßbaren Körperfunktionen (jenseits von Lügendetektor & Co) zu geben scheint. Andererseits auch wieder nicht verblüffend, wenn man das Konzept der holistischen Abhängigkeiten halbwegs akzeptiert… 😉

      • lawgunsandfreedom schreibt:

        @Biorhythmus … tja, genau da gibt’s nix. Das müsste man zuerst mal definieren/erforschen. Vermutlich macht sich deshalb niemand die Arbeit, weil die Hypothese so mager ist.

        Aber es macht sicher auch Spaß einfach ein paar Kurven zu korrelieren und damit die Zeitgenossen zu verwirren. Den kennst Du ja sicher: http://www.tylervigen.com/spurious-correlations

        • ausgesucht schreibt:

          … die Seite (= köstliche Beispiele! 😆 ) kannte ich zwar nicht, hatte sonst aber immer gern für meine Kollegen die bundesdeutsche Geburtenrate mit dem Pro-Kopf-Verbrauch von Rotkohlkonserven in Mecklenburg-Vorpommern korreliert. 😉

  2. jsbielicki schreibt:

    Hat dies auf psychosputnik rebloggt.

  3. YDU schreibt:

    Die Sache mit den verrauschten Daten kenne ich, allerdings habe ich die darauf folgende Mehrdimensionaltiät bis jetzt immer mit Aspirin oder Paracetamol in unsere Dimension übergeführt, da ich die SVM ja nicht kannte. Vielleicht könntest du mir eine Packung SVM zukommen lassen, damit auch damit meine wissenschaftilichen Experimente durchführen kann. Die erhobenen Rohdaten stell ich dir selbstverständlich für weitere Auswertungen zur Verfügung. 😉

    • ausgesucht schreibt:

      Das wäre ja wirklich mal ein spannendes Studienfeld: knallharte Daten über Rausch-zustände, deren Verauschtheit doppelt unscharf auf’s gut durchfeuchtete Bewußtsein drückt… 😉

ein Kommentar ist hier möglich:

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s