Blog durchsuchen
Profil
Andrea Thum berichtet und erklärt die Verwendung von Statistik in Nachrichten und überall sonst.
Letzte Einträge
Kommentare
- Karl · 22.05.12 · 23:21 Uhr Hallo!
- Musikpsychologe · 19.11.11 · 21:24 Uhr Statistik für Anfänger: Der T-Test
- gianna · 14.11.11 · 10:38 Uhr Leben neben Kernkraftwerken
- Dr. Webbaer · 14.08.11 · 15:02 Uhr Sarrazin, die Zweite
- Dr. Webbaer · 31.12.10 · 15:21 Uhr Toxoplasmose und Kohortenstudien
Blogroll
Archiv
Neues in der Kategorie Naturwissenschaften
27. August 2010
Witze!
Kategorie: Naturwissenschaften · Kommentare: 83
Auf die Gefahr hin, dass den schon alle kennen:
Ein Statistiker wird gefragt, wo er begraben werden will.
Seine Antwort: "In Jerusalem, da ist die Auferstehungswahrscheinlichkeit am größten."
Weitere Witze erwünscht (aber nehmt mir nicht alle weg, ich habe noch ein paar für später aufgehoben)
Autor: Andrea Thum· 27.08.10 · 11:57 Uhr· 83 Kommentare
23. August 2010
Statistik für Anfänger: Wer zuviel fragt, kriegt keine Antwort
Kategorie: Naturwissenschaften · Kommentare: 6
Statistik wird ständig in der Forschung verwendet, um Daten auszuwerten und die Erkenntnisse in Zahlen zu gießen. Da viele Biologen und Mediziner, aber auch andere Naturwissenschaftler öfter (meist öfter, als ihnen lieb ist) damit zu tun haben, möchte ich nach und nach eine kleine Wissenssammlung über ständig wiederkehrende Verfahren zusammenstellen. Der T-Test letztes Mal war der Anfang.
Diesmal geht es um etwas wichtiges, wenn man viele Tests macht. Oder wenn man ein Paper liest, in dem viele Test gemacht wurden. Denn wenn man nicht aufpaßt, ist die Aussage wertlos.
Im Beitrag über den T-Test wurde erwähnt, dass man seiner Statistik eine Fehlerwahrscheinlichkeit zugestehen muss, bei uns lag sie bei alpha=5%. Das bedeutet, dass mit einer Wahrscheinlichkeit von 5% unser Test positiv ausfällt, obwohl es doch nur Zufall war. Klingt ziemlich unwahrscheinlich. Und oft wird sogar mit 1% gearbeitet. Das heisst aber auch, dass wenn man in seinem Leben 100 Statistiken gemacht hat, bis zu fünf (bzw. einer) falsch-positiv waren. Gerade, wenn man viele Daten verarbeitet, kommt man schnell in einen Bereich, wo das relevant ist.
Haben wir als Aufgabenstellung... mhm, tja, ach, nehmen wir halt wieder Erbsen. Also, wir wollen herausfinden, welche Erbsensorte von zwei zu untersuchenden größere Erbsen hat, süßer ist, vitaminreicher und vielleicht noch robuster. Das ergäbe 4 Tests (T-Tests) mit jeweils einer Wahrscheinlichkeit von 5%, dass einer der Tests falsch-positiv ist, macht zusammen 1 - 0.95^4 = 18.5% Fehlerwahrscheinlichkeit. Damit lockt man niemanden hinter dem Ofen hervor. Man kann das in einer Veröffentlichung dann einfach nicht erwähnen, geht aber das Risiko ein, dass es jemand merkt - oder dass das Ergebnis tatsächlich Zufall war, auch wenn's gar nicht so aussah.
Was tun?
Das fragte sich schon vor fast 100 Jahren Carlo Emilio Bonferroni aus Italien und empfahl, die sogenannte Alpha-Kummulierung dadurch zu behandeln, indem man ein entsprechend niedrigeres alpha verwendet, als das, was für den Einzeltest gegolten hätte, nämlich alpha/(Anzahl der Tests).
In unserem Fall würden wir also statt auf alpha=5% zu prüfen und bei einer Signifikanz von 4,9 Hurra zu schreien, alle Tests mit alpha=5/4=1.25% durchführen. Das Ganze nennt man die Bonferroni-Korrektur. Damit ist man auf der sicheren Seite, Herr Bonferroni hat nachgewiesen, dass man damit mindestens so sicher sein kann, wie beim Einzeltest.
Leider würden uns so viele Erkenntnisse verwehrt bleiben, da ja die Erbsen vielleicht wirklich süßer waren, aber durch den strengen Test können wir das nicht mit Sicherheit behaupten, wir haben also ein falsch-negatives Ergebnis.
Herr Sture Holm änderte das Verfahren ab und entwickelte die Bonferroni-Holm-Prozedur, sodass mehr Hypothesen eine Chance bekommen abgelehnt zu werden (= dass man mehr Unterschiede zwischen den Sorten findet). Dabei gilt nicht ein alpha für alle Tests, sondern sie werden angepasst. (Für die Details verweise ich auf Wikipedia, sonst wär's redundant.)
Kommt man allerdings in den Bereich, wo man tausende und zehntausende Tests machen muss, ist auch diese Methode zu streng (="konservativ"). Ich kenne das von Microarrays, wo man Unterschiede in der Expression von Genen feststellen möchte und Gene gibt es ja ziemlich viele!

Hier ist man dazu übergegangen, nicht die falsch-positiven Ergebnisse zu kontrollieren, sondern ihr Ausmaß zu kennen. Man gibt sich eine FDR(=false discovery rate) vor, so dass man weiß, wieviele der Tests vermutlich falsch-positiv sind - man weiß nur nicht, welche. Alle positiven Ergebnisse, die man so erhält, versucht man dann biologisch zu begründen und was vielversprechend aussieht, muss mit einer neuen Studie untersucht werden.
Stellt viele Fragen und kriegt auch manchmal keine Antwort:
Andrea Thum
Autor: Andrea Thum· 23.08.10 · 08:30 Uhr· 6 Kommentare
17. August 2010
Statistik für Anfänger: Der T-Test
Kategorie: Naturwissenschaften · Kommentare: 32
In der Statistik dreht es sich häufig um Hypothesen, also Annahmen, die man bestätigen oder zurückweisen möchte. Sind die Erbsen der einen Sorte süßer, als die der anderen? Hilft das eine Medikament besser als das andere? Leben Patienten mit Tumortyp I länger als welche mit Typ II oder werden sogar wieder gesund?
In diesem Zusammenhang arbeitet man oft mit dem T-Test. Weil es immer schön einsichtig ist, nehmen wir ein Beispiel, sagen wir die Größe von Erbsen der einen und der anderen Sorte. Zunächst werden alle ausgemessen und in zwei Listen aufgeteilt.
Bevor wir richtig loslegen, müssen wir kurz überlegen oder in den Daten mal genau nachschauen, ob die Größe der Erbsen einer Sorte jeweils normalverteilt sind. Das heisst, es gibt viele die ungefähr Größe M haben und ziemlich wenige, die viel größer oder viel kleiner als M sind. Die Normalverteilung (=Gaußkurve) ist sicher bekannt, man sieht sie auch oben im Blog-Banner links. So eine Verteilung entsteht, wenn man seine Erbsen (für beide Sorten getrennt) sortieren würde, wie ich es hier gemacht habe: die kleinen links, die großen rechts, in gleich großen Intervallen (bei mir im Beispiel allerdings mehr pi-mal-Daum). Meine Erbsen sind also netterweise tatsächlich ungefähr normalverteilt.

Was ist, wenn die Daten nicht normalverteilt sind? Dann sieht es schlecht aus mit dem T-Test, dann hat der so, wie er berechnet wird, keine ordentliche Aussagekraft. Zum Glück gibt es aber andere Tests, bei denen so eine Voraussetzung nicht erfüllt sein muss, z.B. den U-Test.
Nachdem das geklärt ist, guckt man als erstes auf den Mittelwert: Sind beide Sorten im Mittel unterschiedlich? Das ist schonmal sehr wahrscheinlich, es wird kaum passieren, dass beide Werte exakt gleich sind. Aber sind sie unterschiedlich genug?
Jetzt kommt die Varianz mit ins Spiel. Meine Erbsen sind alle ähnlich groß, die Werte liegen zwischen 5mm und 7mm im Durchmesser. Die Varianz ist jetzt die Abweichung vom Mittelwert(6mm) (MW-xi) zum Quadrat(es werden also die, die weiter vom Mittelwert entfernt sind stärker berücksichtigt, als die in der Nähe), aufsummiert über alle Erbsen und dann geteilt durch n-1. Davon die Wurzel ist die Standardabweichung:

Wer jetzt den letzten Satz einfach übersprungen hat, der möge ihn bitte nochmal lesen, man kann Formeln auch verstehen, nicht nur sie verwenden!
Hätte ich also Erbsen mit größerer Varianz (also auch Standardabweichung) in ihrer Verteilung, dann wären auch welche mit 8mm und 4mm dabei und dafür wäre die Spitze bei den mittleren Werten nicht so hoch, weil es sich ja mehr an den Seiten verteilt. Bei weniger Varianz hätte ich vielleicht nur Erbsen bis 6,5mm und 5,5mm und die Mitte der Gaußkurve wäre höher.

(Quelle: Wikipedia; rot und grün mit höherer Varianz, als blau; grün und blau haben den gleichen Mittelwert)
Nun kann man sich vorstellen: Wenn für beide Erbsensorten die Varianz klein und die Gaußkurve entsprechend schmal und hoch ist, dann wäre ein kleiner Unterschied im Mittelwert (also der Spitzen) von vielleicht 1mm schon aussagekräftig. Dann würden die Flächen der beiden Verteilungen sich nur wenig überschneiden. Wären die Varianzen groß, müssen die Mittelwerte schon deutlich auseinanderliegen, damit man einen echten Unterschied hat, also die Schnittfläche der Verteilungen gering genug ist. Im obigen Beispiel ist die Schnittfläche zwischen roter und grüner Verteilung ziemlich groß!
Jetzt muss man noch berücksichtigen, wie exakt unsere Zahlen sind. Hat man wenig Erbsen gezählt, kann es sein, dass wir uns ziemlich verschätzen beim Mittelwert und der Streuung. Je mehr Erbsen, umso sicherer können wir sein (die Mühe habe ich mir jetzt mal nicht gemacht, das war schon fummelig genug!).
Wenn wir zwei Verteilungen betrachten, müssen wir noch die gewichtete Varianz bestimmt. Da fließen die Varianzen der beiden Stichproben ein, gewichtet mit der Stichprobengröße - die größere Stichprobe hat mehr Einfluß.

Jetzt berechnet der T-Test wie weit die Mittelwerte der beiden Gruppen, x und y, voneinander verschieden sind, normiert durch die gewichtete Varianz (bei großer Varianz weniger aussagekräftig, als bei kleiner) und das wird noch multipliziert mit einem Faktor, der die Anzahl der Erbsen und somit die Verlässlichkeit der Stichprobe berücksichtigt:

(Für die, die auf Genauigkeit pochen: Da es hier mit den Formeln nicht so einfach ist, bzw. ich weiss noch nicht, wie ich die gut setzen kann: x mit Querstrich bedeutet Mittelwert der Stichprobe X, in der Formel steht es richtig, im Text krieg ich keinen Strich draufgezaubert, deswegen steht da nur ein x, es soll aber das gleich heissen.)
Wir haben unser t!
Äh, t?
Das t sagt uns, wie signifikant der Unterschied ist. t kann sowohl negativ als auch positiv sein - negativ bedeutet, dass der Mittelwert x kleiner als Mittelwert y unseres Versuchs war; positiv entsprechend anders herum.
Jetzt müssen wir noch festlegen, wieviel Fehlerraum wir unseren Daten zugestehen wollen. Sagen wir, dass mit einer Wahrscheinlichkeit von 5% es Zufall sein könnte, dass die Erbsen alle zufällig in Gruppe x kleiner als in Gruppe y wären. Diese Fehlerprozente ("alpha") sollten möglichst klein sein, um solche Fehler ziemlich unmöglich zu machen - ausschließen kann man sie aber nie. Die Wahrscheinlichkeit 100-alpha, also hier 95%, ist die Konfidenz, die Sicherheit, dass man richtig liegt.
Mit den Werten t und der Größe der Stichprobe (hier die Anzahl der Erbsen) geht man in einer Tabelle nachgucken, heutzutage fragt man wahrscheinlich das Statistikprogramm, wie groß der Fehler durch Zufall sein dürfte. Ist er kleiner als alpha, sieht es gut aus und man kann das Ergebnis schön publizieren. Ist er es nicht, weiss man nichts. Man könnte neue Tests machen oder sich andere Erbsen züchten. Angeblich sind auch Negativergebnisse nützliche Ergebnisse, erfahrungsgemäß sieht es mit dem publizieren dann aber nicht so doll aus.
So, fragt jetzt noch einer, was man da jetzt im Statistikprogramm oder der Tabelle nachgeguckt hat, dann sollte ich auch diese Frage wohl beantworten.
Das t entstammt einer t-Verteilung mit den Freiheitsgraden n(=Anzahl Erbsen)-1, die sieht ungefähr wie eine Normalverteilung aus, bei größeren n zunehmend schmaler (und höher) mit Mittelwert 0.
Was bedeutet das?
Das bedeutet, dass wenn man sehr viele Tests mit irgendwelchen Daten machte, von denen man wüsste, dass es keine Unterschiede in den Mittelwerten gibt, dann würden die berechneten t-Werte vorrangig in der Nähe von 0 zu finden sein - die Differenz der Mittelwerte ist halt ungefähr null. Selten kann es passieren, dass doch, zufällig, eine größere Differenz ermittelt wird und somit ein größerer t-Wert. Je mehr Daten man hat (größeres n), umso unwahrscheinlicher wird das aber, deswegen sind diese Verteilungen mit hohem Freiheitsgrad schmaler.
Das Statistik-Programm verrät uns also den Flächeninhalt der t-Verteilung ab der Stelle t bis unendlich - das entspricht der Wahrscheinlichkeit, dass wir zwar eine Differenz messen, es aber nur auf Zufall beruht. Sowas nennt man auch ein falsch-positives Ergebnis. Und diese Fehlerwahrscheinlichkeit sollte nach unserer Vorgabe unter dem Wert alpha=5% (5% der Fläche) liegen.
Genug der Erbsenzählerei!
Andrea Thum
Autor: Andrea Thum· 17.08.10 · 09:02 Uhr· 32 Kommentare
06. August 2010
Wahrnehmung
Kategorie: Naturwissenschaften · Kommentare: 170
In jedem Buch über "Unerklärliche Phänomene" findet sich auch ein Kapitel, das man letztlich mit selektiver Wahrnehmung (ich habe auch den Begriff kognitive Verzerrung gefunden) erklären kann.
Das typische Beispiel ist der Mann, der einen Flug nicht antritt, weil er irgendeine Eingebung hatte - und dann stürzt das Flugzeug tatsächlich ab. Mit selektiver Wahrnehmung ist hier gemeint, dass all die Menschen, die eine Eingebung hatten und nicht geflogen sind und wo das Flugzeug dann nicht abstürzte, nicht bekannt sind aber sicher recht groß ist (und wer gibt schon zu, sich sowas eingebildet zu haben?).
Es ist also schlicht Zufall, dass es irgendwann mal tatsächlich mit einem abstürzenden Flugzeug zusammenfällt.

Auf dieselbe Art "wirken" Wundermittel, heiliges Wasser oder Vitamine von Dr. Rath (ich weiss jetzt gar nicht, ob ich das verlinken sollte! - Dr Rath Research): Es werden all die Menschen, die nicht gesund geworden sind, nicht erwähnt, sondern ausschließlich die wenigen, die gesund geworden sind.
Es gibt wohl, wenn auch extrem selten, Spontanheilungen bei Krebs - einer von diesen Glücklichen hat vorher bei Herrn Rath vorbeigeschaut, der dann die Heilung allein seinen Vitaminen oder Medikamenten zuschreiben kann.
Mit diesen Fällen wird dann Werbung gemacht; all die Menschen, die gestorben sind, werden nicht weiter erwähnt, im Gegensatz zu einer ordentlichen Studie.
Doch auch ach so kluge Menschen, wie wir Wissenschaftler, sind nicht vor selektiver Wahrnehmung gefeit. Insbesondere was sogenannte Verschwörungstheorien angeht - und das gilt für beide Seiten. So interpretieren Verschwörungstheoretiker alles in ihrem Sinne und blenden Beobachtungen, die ihre Meinung widerlegen würden, aus. Und die ordentlichen Wissenschaftler halten das alles für Unfug und machen sich keine Gedanken, ob was daran stimmen könnte, weil es eben nicht in ihr Weltbild passen würde.
Die AIDS-Geschichte ist so eine. Ich habe keine Ahnung, wer Recht hat! Es verblüfft mich jedoch, wieviele Wissenschaftler die allgemein bekannten AIDS-HIV-Theorien ablehnen. Ich würde mir da nicht so einen Zweifronten-Krieg, sondern eine ordentliche Diskussion wünschen. Die gibt es auch deswegen nicht, weil die, sagen wir mal "anerkannten Wissenschaftler" es nicht für nötig halten, die Argumente der Gegenseite zu entkräften.
Und ein bisschen selektive Wahrnehmung findet man auch bei der Angst einer Bekannten, die, nachdem ein Freund tatsächlich mit einem Flugzeug abgestürzt ist, kein Flugzeug mehr betreten mag, auch wenn Autofahren (und das tut sie ganz viel) bekanntlich viel gefährlicher ist. Aber Ängste sind sowieso irrational, da sollte man nicht drüber lächeln, ich habe Angst vor der Dunkelheit, obwohl mir noch nie was im Dunkeln passiert ist, keine Monster und Werwölfe, nichts! Ich schiebe es auf die Gene: Forscher entdecken Angst-Gen.
Klopft nie auf Holz, wünscht sich aber immer was beim Wimpern-Wegpusten:
Andrea Thum
Nachtrag: Nach all der auf diesen Beitrag folgenden Diskussion nehme ich das pauschale: "Die gibt es auch deswegen nicht, weil die, sagen wir mal "anerkannten Wissenschaftler" es nicht für nötig halten, die Argumente der Gegenseite zu entkräften." zurück. Es gibt durchaus Wissenschaftler, die sich bemühen und etliche in den Kommentaren aufgezählte Seiten. Meine selektive Wahrnehmung hat mir nur die in Erinnerung belassen, die das nicht tun.
Autor: Andrea Thum· 06.08.10 · 09:40 Uhr· 170 Kommentare
03. August 2010
Reiche Deutsche
Kategorie: Naturwissenschaften·Politik · Kommentare: 43
An der fast jedes Jahr wiederkehrenden Nachricht, dass die Deutschen wieder reicher geworden sind, kann man schön den Unterschied zwischen
Median und Mittelwert beobachten. Und wie, je nachdem welche Botschaft vermittelt werden soll, eines der beiden eingesetzt wird.
Also ich bin nicht reicher geworden. Und die errechneten 150.000 Euro habe ich schon mal gar nicht. Natürlich bin ich als Einzelfall nicht aussagekräftig, also schauen wir uns alle Deutschen an.
Der Mittelwert ist bekanntlich die Summe über alle Werte, geteilt durch die Anzahl der Werte. Es werden also in diesem Fall alle Vermögen addiert und durch die Anzahl der erwachsenen Personen geteilt. Heraus kommen aktuell 150.000 Euro pro Nase für alle ab 17 Jahren (Quelle: DIW)
Das wäre von der Aussage her in Ordnung, wenn die Verteilung über die Vermögen gleichmässig wäre, also gleich viele Leute reich wie arm wären. So aber verfälscht die geringe Zahl an sehr reichen Leuten den Eindruck.

Was würde uns statt dessen der Median sagen? Er bestimmt, wenn man alle Erwachsenen in einer Reihe aufstellen würde und zwar sortiert nach Vermögen, und dann den, der genau in der Mitte steht, fragt, wieviel Geld er hat. Da kommt ein viel kleinerer Wert heraus. Und Ganz sicher ist dieser Wert in den letzten Jahren nicht so stark gestiegen.
Ich habe nur die Statistik bis 2007 beim DIW gefunden (Seite 57). Da liegt der Mittelwert 2007 bei 88.000 Euro, der Median dagegen bei 15.000 Euro. Und während das durchschnittliche Vermögen im Vergleich zu 2002 um 10% stieg, stieg der Median um 2%. Im Osten Deutschlands sank das Vermögen sogar.
Die Deutschen sind also im Median kaum reicher geworden. Die Inflation rausgerechnet (im Schnitt 1,5% pro Jahr im angegebenen Zeitraum) sogar ärmer! Und was sagt uns das? Tja, das, was wir so schon immer wieder hören: Die Schere zwischen Arm und Reich geht immer mehr auseinander. Und interessanter Weise wird in den Zeitungen und überall sonst immer nur der Mittelwert genannt, der uns wohl sagen soll, dass es uns doch eigentlich immer besser geht und wir mal nicht so rumjammern sollen.
Ist statt reich lieber geist-reich:
Andrea Thum
Autor: Andrea Thum· 03.08.10 · 20:30 Uhr· 43 Kommentare
Top5
- Liebe Piraten, lasst uns endlich vernünftig miteinander reden!Astrodicticum Simplex· 14.05.2012
- Impft Eure Kinder! Die Masern sind zurück!blooDNAcid· 09.05.2012
- Dr. h.c. im Sonderangebot für 39 Euro[sic]· 14.05.2012
- Wer braucht Forschungsreaktoren - Atomforschung abschaffen? Astrodicticum Simplex· 09.05.2012
- Die Erde dreht sich nicht um die Sonne...Astrodicticum Simplex· 12.05.2012
Top5
- Impft Eure Kinder! Die Masern sind zurück!blooDNAcid· 09.05.2012
- Liebe Piraten, lasst uns endlich vernünftig miteinander reden!Astrodicticum Simplex· 14.05.2012
- Gibt es ein "generisches Maskulinum"?Hier wohnen Drachen· 11.05.2012
- Sollten wir auf Fleisch verzichten?evolvimus· 11.05.2012
- Die kalte Sonne von Vahrenholt/Lüning: Le Trend, c'est moi!Primaklima· 16.05.2012
ScienceBlogs.com
- Doubt and other products: The National Toxicology Program's Report on Carcinogens, bad for whose business?by Elizabeth Grossman As it pursues its anti-regulatory agenda the ...The Pump Handle· 22.05.2012 · 16:39 Uhr
- Weekend Recap: My Annular Eclipse Expedition!A little more persistence a little more effort and what ...Starts With A Bang· 22.05.2012 · 00:11 Uhr
- Water, waterThis image has been going around the intertubes recently I ...A Few Things Ill Considered· 21.05.2012 · 22:59 Uhr
- To be or not to be? The Prevention and Public Health Fundby Kim Krisberg We will pay for this by taking ...The Pump Handle· 21.05.2012 · 15:19 Uhr
- An important revelation regarding Heartland Gate (global warming denialism)Peter Gleick has been cleared of faking a key memo ...Greg Laden's Blog· 21.05.2012 · 12:52 Uhr
