Dienstag, August 31, 2021

Die Geschichte der Logik und Bayes Theorem - oder was den Stammtisch von der Wissenschaft unterscheidet (Part 2)

Hallo liebe Freunde, (Ex-)Kollegen, Pokerspieler, Zauberer, Instagram-Abonnenten und random- Blogleser,

willkommen zurück zu einem neuen Blog!


Ich hatte es im letzten Blog angedeutet, wir behandeln aktuell einen Zwei-Teiler, die miteinander in Verbindung stehen.




Teil 1 (letzter Blog)
Geschichte der Logik (Theorie)

Als Grundlage dient uns die "Geschichte" der Logik, mit der Frage, was denn Logik ist, wie sie aufgebaut ist, wer sie ursprünglich begründet und argumentiert hat und wie man sie herleitet, ableitet und natürlich anwendet.


Teil 2 (dieser Blog)
Bayes Theorem (Praxis)

Bayes Theorem ist ein stochastisches (mathem./wahrscheinl.) Vehikel, mit dessen Hilfe man eine (oder mehrere) Thesen, auf deren Wahrscheinlichkeitsgrad hin, prüfen oder miteinander vergleichen kann, ohne spezielle Vorkenntnisse zu haben. Essentiell ist hierbei die Voraussetzung, dass es sich um bedingte Wahrscheinlichkeiten handeln muss, also wenn A, dann B oder wenn B dann A.
Klingt verrückt - ist es aber nicht!


Falls Ihr Teil 1 noch nicht gelesen habt, holt das flux nach, so habt Ihr bei "Wer wird Millionär" eine 2,9% höher Chance die 64.000 EUR zu gewinnen.

Wieder da? 16 Tage später? Gut - dann geht`s heute an die Praxis, nachdem wir die Theorie alle toll (schwer) verdaut haben.

Schon seit Menschengedenken geistert die Frage umher, wie man denn Wahrheit erkennt, misst, beurteilt und benennt, wie lange sie denn gültig ist und wie man sein Wissen, sich auf der einen Seite aneignet und auf der anderen Seite aber auch "updated". Wir kennen das alle sicher gut, einmal falsch (oder veraltet) gelernt, ist es viel schwerer um-zu-lernen als neu-zu-lernen.

Denn es gilt:
"Knowledge is Power!"

Ferner gilt, induktiv, auch:
"Old knowledge (often) has no power." 

Das Wort "old" bedarf hier einer Begriffserklärung.
Es bezieht sich auf relativ neues Wissen, welches unter aktuellen Umständen bereits veraltet ist.   
(Bsp.: Corona Informationsstand Dez. 2020 vs. Dez. 2021) 

Bei ganz altem Wissen besteht, witzigerweise, kaum eine Gefahr, dass es nicht mehr up to date ist.
Der Informationsstand über die Griechen, Römer, die Bibel und die Baukunst der Goten wird sich keiner dramatischen Veränderung mehr unterziehen, von kleineren Ausnahmen (Ausgrabungen) mal abgesehen.

Leider überprüfen wir unser Wissen viel zu selten auf Neuerungen und hinterfragen uns zu wenig selbst, ob denn das, was wir fest glauben, auch noch der Realität entspricht.
In der heutigen, schnelllebigen Zeit, in der wir nur so mit Information, Bildern, Schlagzeilen, Posts und Tags bombardiert werden, ist das ein ernstes Problem, dem sich jedes Individuum, mit einem IQ von über 73 stellen sollte. (RTL-RTL2-SAT1-Kabel-1-und/oder Reality-Show-Zuschauer können, wie immer, den Blog komplett auslassen und einfach runter zu den Bildern scrollen - Tschüsss dann!)

Für den Rest geht`s hier weiter.



Bayes Theorem

Für eine Hypothese  mit den Hinweisen  mit  lässt sich die Wahrscheinlichkeit von unter der Bedingung, dass  eingetreten auch dadurch berechnen, dass man prüft, wie die Wahrscheinlichkeit ist, dass B messbar ist, wenn A gegeben ist. 



Klingt verwirrend, ist es aber gar nicht (so).



Fangen wir mit Harald Böckler an, Harald ist in sich gekehrt, eher schüchtern und zurückhaltend, sehr ordentlich und sanftmütig, versucht die Außenwelt eher zu meiden, ist zwar hilfsbereit, zeigt aber wenig Interesse anderen Menschen gegenüber. Er hat ein eingebautes Verständnis nach Struktur und ist detailverliebt.

Hier nun die Frage an Euch: 
Ist Harald nun ein Bibliothekar oder ein Bauer? 
Schnell und intuitiv getippt oder richtig nachgedacht? Macht keinen großen Unterschied...

Die Antwort von 100 Amerikanern ist zumindest, dass 90 glauben, er sei Bibliothekar und lediglich 10 Leute glauben, er sei Bauer. (Studie USA, Kahneman/Tversky, ca. 1980)
Der richtige Wert ist allerdings weit davon entfernt - wie kann das sein?


Wenn wir uns an Aristoteles erinnern, kommt mir hier der Begriff "a priori" in den Sinn. Eine Vor-Annahme, die als gegeben hingenommen wird und keiner empirischen Überprüfung bedarf.
"Wir gehen davon aus, dass...." 
(Ich gehe hier aus dramaturgischen Zwecken mit dem Begriff etwas lax um, er kann auch anders interpretiert werden.)
Aus a priori haben die Amis "prior" gemacht - und zwar "prior belief" der "vorherige Glaube."

Der vorherige Glaube in unserem Beispiel könnte unser "Klischee" oder eine stereotype Schublade und Sichtweise sein, die wir anhand der menschlichen Eigenschaften zuordnen. (schüchtern, zurückhaltend, ordentlich, in sich gekehrt) 
Wir verbinden mit diesen Charaktereigenschaften viel mehr den Bibliothekar als den Bauern, für den haben wir intuitiv dann eher andere Eigenschaften im Kopf.
Was wir vollkommen außer Acht lassen, ist die Tatsache, dass es viel mehr Bauern als Bibliothekare gibt, somit egalisiert sich unsere starke, intuitive Annahme durch die "gegnerische" Masse der Bauern.
Zum Zeitpunkt der Studie in den 80er Jahren gab es 20 mal mehr Bauern als Bibliothekare (heute sogar 60 mal mehr), was selbstverständlich einen großen Einfluss auf die Frage hat, ob es sich um einen Bibliothekar handelt oder nicht.
Wir halten kurz inne und fragen, was hier gerade geschieht?

Wir stellen uns nicht mehr die Frage von entweder oder, (issers oder issers nicht) sondern wir wandeln diese Frage um, in wie hoch ist die Wahrscheinlichkeit, dass unsere Hypothese stimmt, unter der Verteilung der Möglichkeiten, deren Gewichtung und dann abzüglich der Wahrscheinlichkeit, dass die Annahme falsch ist - ein großer Unterschied, oder?

Wir bewegen uns weg von einer qualitativen (binären) Aussage hin zu einer Quantitativen.

Kahneman spricht von einer Baserate.
Ich kann dieses Wort nicht genug unterstreichen und wiederhole es im Geiste, bis ich heiser werde!

Für unser Beispiel bedeutet das, dass in den 1980ern von 210 Personen, die alle entweder Bibliothekare oder Bauern waren, 200 Bauer darunter sind und nur 10 Bibliothekare. So kommen wir auf eine Quote von 20:1 - auf jeden Bibliothekar kommen 20 Bauern. (Baserate)
Das ist die Realität - wir können nun schon kühn vermuten, dass die Fehleinschätzung irgendwie mit diesem Bild kollidiert, oder? Schauen wir uns das an.

In der obigen Gleichung gibt es an sich nur zwei Platzhalter, A und B.
Das P steht für Probability, also Wahrscheinlichkeit. 
Das A ist unsere (als wahr angenommene) Hypothese. (Es IST ein Bibliothekar) 
Das B sind die Hinweise/Beweise/Anzeichen.

So schlüsseln wir die "Terme" einzeln auf.
P (A|B) liest man wie "Wahrscheinlichkeit von B, wenn A gegeben ist" = Wahrscheinlichkeit, dass unsere These korrekt ist, wenn wir Beweise dazu haben.
P (B|A) liest man wie "Wahrscheinlichkeit, dass ich die Beweise sehe, gegeben dem Fall, dass meine Hypothese richtig ist.
P (A) ist die Wahrscheinlichkeit, dass unsere Hypothese stimmt, ohne irgendwelche Beweise zu haben.
P (B) ist die Wahrscheinlichkeit, die Beweise überhaupt zu sehen. 

Jetzt haben von der Definition her fast alles was wir brauchen.
Rechnen wir mal ein wenig... ufff - Mathe! Nicht heulen, es ist recht easy.

Zuerst fragen wir uns mal locker, ohne groß zu nachdenken, wie viel unsere 10 Bibliothekare denn auf die Charakterbeschreibung oben zutreffen (schüchtern, zurückhaltend, ordentlich, in sich gekehrt)
Was haltet ihr von 40%? (unser P (B|A)D.h. 4 von diesen 10 passen in unser Schema. Gut. Was noch?
Jetzt fragen wir uns, wie viele der Bauern denn zu diesen Charaktereigenschaften passen? Hmmm, weniger - sagen wir mal 10% d.h. dass 20 von 200 Bauern in unser Schema passen.

Merkt ihr was? Obwohl wir uns 4 mal so sicher sind, dass die Eigenschaften besser zu den Bibliothekaren passen (40% zu 10%) haben wir aber nominal nur 4 Bibliothekare gegenüber 20 Bauern. Woher kommt das? Es kommt allein aus der Baserate 20:1 (unser P (A) =1/21) also der Verteilung und Gewichtung der Population. Unsere Meinung spielt eine komplett untergeordnete Rolle, die schiere Menge entscheidet viel mehr, als unsere Zuversicht in unsere Annahme.
Unser P(B) ist 24 (20+4) von 210 ) also alle Personen, auf die die Eigenschaften zutreffen.
Durchatmen... 


Ok, rechnen wir nun unsere "wirkliches" Ergebnis aus.
Wir erinnern uns oben, dass 90% der Befragten dachten, es sei ein Bibliothekar.

Wir können jetzt unsere Werte in die Gleichung einsetzen. (einfache, verkürzte Version)

                                                                                4
P(Bibliothekar | Charaktereigenschaften)       一一   = 16,7 %
                                                                             4 + 20


Also zwischen 90% und 16,7 % ist eine recht große Lücke, will ich meinen und das, obwohl sich wahrscheinlich auch noch viele Personen "sicher" waren, dass sie nah dran seien oder zumindest, nicht weit vom richtigen Wert entfernt.

Hier ist natürlich ein Wort der Vorsicht angebracht und vielleicht hat es auch schon der ein oder andere bemerkt. Wie komme ich denn nun überhaupt auf die 40% und 10% der vermeintlichen Zuordnung der Eigenschaften auf die beiden Personengruppen - einfach! Ich rate, vermute, sinniere und überschlage.

Das mächtige Werkzeug von Bayes Theorem ist genau die Tatsache, dass es nicht zu sehr darauf ankommt, was ich in die Gleichung eingebe, sondern lediglich, dass es der Realität entsprechen könnte, natürlich ohne eklatanten Selbstbeschiss. Ich kann bestimmt nicht davon ausgehen, dass alle Bibliothekare introvertierte, verklemmte Bücherwürmer sind, wie auch sicherlich die Bauern nicht alle gehirntote, holzklotzige Halbseiten sein können. 
Ziel ist es, seinen Glauben etwas an die Realität anzupassen und nicht umgekehrt! Großer Unterschied.
In der Praxis nennen wir diesen "Holzweg" Confirmation Bias - wir haben schon oft davon gesprochen.

Außerdem kann ich ja immer wieder geänderte Werte in die Gleichung eingeben, um zu sehen, wie sich das Bild ändert. 
(Selbst bei 60% Bibliothekar und 5% Bauer kommt nur ein 37%ige Wahrscheinlichkeit raus, dass es ein Bibliothekar ist.)

Krasse Sache!
Hier schmeißt der Stammtisch lange schon seine "Intuition" aus dem Fenster und müsste kapitulieren.
Wir sprechen hier nicht von einem Trickspielzug oder einem fiktiven Mechanismus, ganz im Gegenteil, es es rein zahlen- und praxisbezogen, dazu oft noch relativ schnell, wenn man den Dreh erstmal raushat.

Wir können hiermit leicht Impfgegner, Schlagzeilenschreiber und Sensationsjäger schachmatt setzen, in dem man Zahlen einsetzt und nicht nur Meinungen äußert.
Versucht es mal an der Trinkhalle am Eck. :- )

Bayes Theorem wird in der Wissenschaft zur Hypothesenprüfung im Allgemeinen oder auch im mashine-learning, bei Algorithmen und in der Schatzsuche auf hoher See, im Speziellen, angewandt, um nur einige Gebiete zu nennen.


Noch eine Sache, die es sich lohnt, zu erwähnen:
Oft wissen wir nicht, wie unser "prior belief" (9/1) im Verhältnis zu den wirklichen Zahlen steht (1/21) und es ist auch nicht so wichtig, wichtig ist, dass wir uns überhaupt fragen, welche Zahlen relevant sind und ob wir uns der eigenen Meinung so sicher sein können.
Die Baserate wird sehr oft komplett ignoriert, ist aber extrem wichtig. (Ich bin fast heiser)


Ich versuche mir mehr und mehr anzugewöhnen, keine Meinung zu haben, wenn ich keine Ahnung hab - das ist robust - viel besser als ne feste Meinung zu haben- bei keiner Ahnung!

Es geht nicht darum, seine Meinung anhand von neuen Informationen umzudrehen, sondern, seine Meinung anzupassen, zu reflektieren und zu hinterfragen. So lernen und bilden wir uns richtig, ohne uns selbst den Kopf fi**en zu lassen. Das ganze gerne etwas kritisch, offen, bescheiden und neugierig.


Außerdem ist es keine Schande zu sagen: Ich weiß ich nicht! 
(Da macht man, auch am Stammtisch, nix verkehrt, bedarf aber manchmal etwas mehr Mut.)

Ich denke, wir haben mit dem zweiten Teil gezeigt, worin der Unterschied zu der Logik aus Teil 1 zu Der aus Teil 2 bestand.
Aristoteles` Logik ist klar beschränkend, eindeutig-resultierend, oft intuitiver, "absolut" und semantisch eingebettet.
Sie kommt wie eine "qualitative" Logik daher, wenn ich das so sagen darf.

Die Logik aus Teil 2 - Bayes Logik, wollen wir sie mal nennen, ist eher auf dem "quantitativen" Feld
etabliert, teilweise contra-intuitiv und zahlen/- quotenorientiert, somit viel "relativer" und gewichtend.

Vorsicht ist immer geboten, sicherlich mehr noch bei der Bayes`schen Logik....





So, das war doch gar nicht so schlimm - oder?

Ich kann hierzu ein sehr gutes YouTube-Video empfehlen, einfach HIER drücken.
(Kanal: 3Blue1Brown) 
Es erklärt alles perfekt, sogar in einem Schaubild, was vieles grafischer deutlicher macht.





Hier zum Runterkommen und zur Belohnung noch etwas Drink- und Foodporn!
 



                                                     Between the Sheets


                                            Ancient Mariner


                                                     Chief Lapu Lapu


                                           Mai Tai


                                                     Manhattan


                                                     Rye Tai


                                                      Mint Julep


                                           Hinky Dinks Fizzy


                                                     Kentucky Buck


                                                     Royal Bermuda Yacht Club


                                                      Ports of Pain
  













Vielen Dank für` s lesen und bleibt dabei, wenn es heißt:


"Never judge a dynamic system with a static mind." 

(Gillig 2021)





Cheers und enjoy!
icemann





Follow me on Instagram: icemann_10