Statistik und Datenanalyse: Aufbau
Begleittext zum Modul am IKMZ im HS22
Zürich, Herbst 2022
Einleitung
Sicher freuen Sie sich schon auf "Statistik: Aufbau", und ich glaube, Sie haben allen Grund dazu. Manche freuen sich weniger - was ja auch normal und ok ist. Wieder andere, denken lieber daran, wie das Leben so sein wird, wenn Sie "Statistik: Aufbau" hinter sich haben. Ihnen allen will ich zur Seite stehen, damit Sie aus dem Modul das für sich Beste rausholen. Diejenigen, die in der Statistik ein mächtiges Tool entdecken, will ich ein tiefergehendes Verständnis ermöglichen. Denen, die die Statistik einfach gut absolvieren wollen, soll das Wichtigste vermittelt werden und die mit Graus auf das Modul schauen, soll das Grauen genommen und etwas Greifbares und Handhabbares angeboten werden, das sich -- mit zumutbaren Investitionen -- lösen lässt. Hier in der Einleitung schreibe ich Ihnen, was ich über den Sinn, die Mächtigkeit und die möglichen Ursachen für das Unbehagen denke.
Liebe Grüsse
Benjamin Fretwurst
0.1 Was bringt uns Statistik
Statistik ermöglicht es, eine Unmenge an Beobachtungen in Beziehung zueinander zu setzen. Die Art dieser Beziehungen wird aus der Alltagswahrnehmung abgeleitet und durch Formulierung wissenschaftlicher Hypothesen konkretisiert.
Wenn wir zum Beispiel davon sprechen, dass die Leute einfach nur das wichtig finden, was Ihnen die Medien vorgeben, dann wird damit ein Zusammenhang formuliert. Etwas konkreter würde ein KW-ler sagen: Die Menschen lernen aus der Thematisierung in den Medien, was wichtige Themen sind. Und weil das eine Theorie ist, bekommt sie auch noch einen Namen: "Agenda-Setting" (AS).
Gegen den AS könnte man einwenden: "Das gilt nicht immer. Die Leute kriegen schon mit, wenn die Preise steigen -- dazu brauchen sie nicht die Medien." Der AS gilt also nicht für alle Themen, sondern nur für solche, die die Leute nicht am eigenen Leib erfahren können. Es wird also in 'obtrusive' und 'nonobtrusive Issues' unterschieden. Jetzt haben wir einen Zusammenhang formuliert, der zusätzlich Randbedingungen enthält. Abgesehen von der Theorie könnte man die Forschungsfrage stellen, ob AS in gleichem Masse für Gebildetere und weniger Gebildete gilt. In der Alltagsbeobachtung wird es jetzt schon kompliziert, da wir diese Randbedingungen schwerlich alle gleichzeitig gegeneinander halten können. Selbst wenn wir den Bildungsstand mitbeobachten können, ist das nicht mit der vollen Differenziertheit möglich. Die wissenschaftliche Datenerhebung dient der Aufzeichnung vieler unabhängiger Beobachtungen. Multivariate Statistik ermöglicht es uns, diese Beobachtungen so zueinander in Beziehung zu setzen, dass wir am Ende einfache Kennwerte bekommen, die für Zusammenhänge stehen.
Was beschreibt die Funktion von Statistik am besten?
0.2 Mächtigkeit und Unbehagen mit Mathematik und Statistik
Russell über die Mächtigkeit der Algebra:
"Tatsache ist, dass die Algebra zuerst den Geist lehrt, allgemeine Wahrheiten zu erwägen, die nicht nur für dieses oder jenes bestimmte Ding gelten sollen, sondern für jede Einheit einer ganzen Gruppe von Dingen. Auf der Fähigkeit, solche Wahrheiten zu verstehen und zu entdecken, beruht die tatsächliche oder mögliche Herrschaft des Geistes über die ganze Welt der Dinge." (Russell 2015, S. 66)
David Foster Wallace über die Mühe mit der Abstraktion:
In die Abstraktion sind alle Arten von Problemen und Kopfschmerzen eingebaut, das wissen wir alle. Die Gefahr kommt teilweise daher, dass wir Hauptwörter verwenden. Hauptwörter stehen für Gegenstände -- Mann, Pult, Schreibgerät, David, Kopf, Aspirin. Eine spezielle Art von Komik entsteht, wenn Verwirrung darüber herrscht, was ein echtes Hauptwort ist, etwa in den Witzen aus Alice im Wunderland: "Was siehst du auf der Straße?" "Nichts." "Was für ein tolles Sehvermögen! Wie sieht Nichts denn aus?" Tendenziell verschwindet die Komik aber, wenn die Hauptwörter Abstraktionen bezeichnen, also allgemeine Begriffe, die von speziellen Beispielen losgelöst sind. Viele dieser Abstraktions-Hauptwörter sind von Verben abgeleitet. "Bewegung" ist ein Hauptwort, auch "Existenz" -- Wörter dieser Art verwenden wir andauernd. Die Verwirrung kommt auf, wenn wir überlegen, was sie denn genau bedeuten. Das ist wie bei Boyers Aussage zu den ganzen Zahlen. Was bezeichnen "Bewegung" und "Existenz" wirklich? Wir wissen, konkrete einzelne Dinge existieren, und manchmal bewegen sie sich. Gibt es Bewegung an sich? Auf welche Weise? Auf welche Art existieren Abstraktionen? Die letzte Frage ist selbstverständlich ebenfalls sehr abstrakt. Jetzt spüren Sie vielleicht, wie die Kopfschmerzen anfangen. Solches Zeug bringt eine spezielle Art von Unbehagen oder Ungeduld mit sich, wie "Was ist Existenz eigentlich?" oder "Was meinen wir genau, wenn wir von Bewegung reden?". Das Unbehagen ist unverwechselbar und setzt erst ab einer bestimmten Stufe des Abstraktionsvorgangs ein -- weil Abstraktion stufenweise verläuft wie Exponenten oder Dimensionen. Sagen wir, auf Stufe eins steht "Mensch" für einen bestimmten Menschen. Stufe zwei ist, wenn "Mensch" die Spezies meint. So etwas wie "Menschheit" oder "Menschlichkeit" ist dann Stufe drei, und nun sprechen wir über die abstrakten Kriterien für etwas, das einen als Menschen qualifiziert. Und so weiter. So zu denken kann gefährlich sein, unheimlich. Denkt man nur abstrakt genug über etwas nach ... sicher haben wir alle die Erfahrung gemacht, dass wir über ein Wort nachdenken -- sagen wir "Kugelschreiber" -- und es uns so lange vorsagen, bis es aufhört, etwas zu bedeuten: die Merkwürdigkeit, etwas einen Kugelschreiber zu nennen, zwingt sich dem Bewusstsein auf gruselige Weise auf, wie eine epileptische Aura.
...
Theorie: Die Bedrohungen und Gefahren abstrakten Denkens sind ein guter Grund, warum wir inzwischen alle so gern geschäftig sind und uns ständig mit Reizen bombardieren lassen. Abstraktes Denken überfällt einen gern in Augenblicken stiller Ruhe. Wie etwa am frühen Morgen, besonders, wenn man kurz vor dem Lärm des Weckers aufwacht -- dann kann einem plötzlich und grundlos einfallen, dass man jeden Morgen aus dem Bett gestiegen ist, ohne den leisesten Zweifel zu hegen, dass einen der Boden tragen würde. Liegt man nun da und überdenkt die Sache, scheint es zumindest theoretisch möglich, dass ein Fehler in der Konstruktion des Bodens oder seines molekularen Zusammenhalts eine Wölbung hervorrufen könnte, oder dass man gar wegen eines abweichenden Teilchens im Quantenfluss oder sonstwas plötzlich durch ihn hindurchschmelzen könnte. Soll heißen, es scheint logisch nicht ausgeschlossen oder so. Nicht dass man wirklich befürchtet, der Boden würde in einem Augenblick nachgeben, in dem man wirklich aus dem Bett steigt. Aber gewisse Stimmungen und Denklinien sind einfach abstrakter und nicht nur auf irgendwelche Notwendigkeiten oder Pflichten ausgerichtet, für die man aus dem Bett rausmuss.
...
Noch ein sicheres Merkmal für abstraktes Denken: Man hat sich noch nicht bewegt. Es fühlt sich an, als würde ungeheuer viel Energie und Mühe aufgewandt, und man liegt immer noch völlig reglos da. All das spielt sich nur im Kopf ab. Das ist total unheimlich: Kein Wunder, dass die meisten Menschen es nicht mögen. Plötzlich ergibt es einen Sinn, weshalb man Verrückte so häufig als Menschen darstellt, die sich an den Kopf greifen oder ihn gegen irgendetwas schlagen.
...
Die Fähigkeit, beim abstrakten Denken einen Strich zu ziehen, sobald man erkennt, dass es nicht endet, gehört zu dem, was gesunde, funktionierende Menschen -- Menschen, die sich, wenn der Wecker schließlich loslegt, ohne ängstliche Erwartung auf die Socken machen und in die konkreten Aufgaben des Arbeitsalltags eintauchen -- von denen unterscheidet, die den Verstand verloren haben. (Wallace 2015, S. 18)
0.3 Warum multivariat?
Mit einfachen Tabellen können wir die vollständige Informationen darstellen, die wir in der Erhebungsphase gewonnen haben. Wir können die Anzahl gemessener Ausprägungen zusammenfassen, falls es sonst in den Tabellen zu unübersichtlich wird. Das Problem besteht darin, dass wir mit bivariater Statistik nicht das gesamte Zusammenspiel vielfältiger Einflussgrössen kontrollieren können. Wir können z.B. nur einen "durchschnittlichen" Effekt der Thematisierungsfunktion der Medien untersuchen. Natürlich könnte man zwei Tabellen produzieren, eine für obtrusive Issues und eine für nonobtrusive Issues, aber wenn dann noch der Bildungsstand, das Alter, Geschlecht und weitere Themeneigenschaften dazukommen, müssten wir zu viele Tabellen interpretieren. Vom Argument der Fülle einmal abgesehen, können wir immer nur zwei, maximal drei Einflussgrössen gleichzeitig kontrollieren. Wir müssten immer die Einflüsse der übrigen Kalkulationen gedanklich mitschleppen. Selbst wenn uns das gelingt, bleibt die Kontrolle dennoch vage. Rechnet man also bivariat, muss man "multivariat" interpretieren. Die multivariate Statistik ermöglicht es uns bivariat zu interpretieren, weil die übrigen Einflüsse immer schon statistisch konstant gehalten, also kontrolliert werden.
0.4 Zur Verwendung dieser Seite
Die kleinen Aufgaben auf der Seite sind nicht dieselben wie die Lernerfolgsfragen (LEF) unseres Statistik-Aufbau-Moduls. Sie sind eigentlich eher Auflockerungen im Lesefluss und kleine Checks des Gelesenen.
Wenn Ihnen das Zeichen "IYI" begegnet, dann folgt eine tiefergehende Erläuterung steht, für den FAll, dass es Sie interessiert (If You're Interested). Der Stoff ist nicht klausurrelevant.
Wenn Ihnen dieses Zeichen begegnet, dann hat es dazu bereits Fragen gegeben und ich habe die Erklärung dazu in den Begleittext kopiert.
Zitation: Fretwurst, B. (2022). Statistik und Datenanalyse: Aufbau. Begleittext zum Modul am IKMZ im HS22. https://www.ikmz.uzh.ch/static/methoden/Statistik-Aufbau/. Abrufdatum: [aktuelles Datum].