Struktur
Übersicht
Der Kurs beginnt mit dem Einführungsteil, in dem die Grundlagen in Wahrscheinlichkeitsrechnung und Statistik nochmals repetiert werden. Zusätzlich gibt es für Kursteilnehmende, die bis anhin nicht mit R gearbeitet haben, eine Einführung in R (fakultativ). Mehr Details zu den Kursen findet man unten.
Nach dem Einführungsteil werden im Grundlagenteil in zwei Semestern jeweils der erste Teil von Vorlesungen über die allgemeinen Konzepte der Themenbereiche
- Regression
- Varianzanalyse und Versuchsplanung
- Multivariate Statistik
- Zeitreihenanalyse
besucht. Damit ist das CAS abgeschlossen. Mehr Details zu den Kursen findet man unten.
Nach erfolgreichem Abschluss des CAS kann zur Erreichung des DAS aus dem breiten Angebot des Aufbauteils frei ausgewählt werden. Zudem wird im Rahmen des Workshops ein Problem aus dem eigenen Arbeitsgebiet vorgestellt und die Diplomarbeit geschrieben.
Alle Details dazu findet man unten.
Details
Einführungsteil (CAS)
Zeit: April - Ende Juni / Anfangs Juli (genaue Daten sind hier aufgelistet)
Im Einführungsteil werden die Grundlagen nochmals repetiert und (fakultativ) eine Einführung in R angeboten:
Wenn beispielsweise die Zahl der Diebstähle von einem Jahr zum nächsten zunimmt, stellt sich die Frage, ob dies auf eine Änderung der Verhaltensweise zurückzuführen sei, oder ob es sich dabei um eine "zufällige Schwankung" handle. Um solche Fragen zu beantworten, braucht man ein Modell für den Zufall - das Modell der Wahrscheinlichkeiten.
Die Schliessende Statistik schlägt eine Brücke zwischen den Modellen der Wahrscheinlichkeitstheorie und den Daten. Sie hilft, zwischen "echten" (systematischen) und zufälligen Änderungen zu unterscheiden, sowie die Genauigkeit von Durchschnitten, Trends und anderen aus den Daten ausgerechneten Grössen anzugeben.
Die Teilnehmenden sollten diese Überlegungen bereits kennen. Dieser Teil ist als Repetition zu verstehen und bildet die Grundlage für die weiteren Teile.
Stichworte zum Inhalt:
- Wahrscheinlichkeit
- Zufallsvariable und Verteilungen
- Verteilung von Funktionen einer oder mehrerer Zufallsvariablen
- Summen von Zufallsvariablen und Grenzwertsätze
- Schätzungen
- Tests
- Vertrauensintervalle
- Statistik für eine und zwei Stichproben
Grundlagenteil (CAS)
Im Grundlagenteil wird in zwei Semestern jeweils der erste Teil von 4 Vorlesungen besucht:
Herbstsemester (erste Semesterhälfte; in der zweiten Hälfte kann bei Interesse die für den DAS relevanten Teile besucht werden, siehe unten):
In der Regression geht es darum, Modelle zu entwickeln, um die Werte eines Merkmals, durch die Werte mehrerer anderer Grössen zu erklären oder auch vorherzusagen. Die Problemstellungen sind so vielfältig, dass die Regression als die am weitesten verbreitete statistische Methodik gelten darf.
Der erste Teil beschränkt sich auf die einfache und multiple lineare Regression und vermittelt die Denkweise der explorativen Modell-Entwicklung, die auch für andere statistische Gebiete grundlegend ist.
Stichworte zum Inhalt:
- Modelle der einfachen und der multiplen linearen Regression
- Residuen-Analyse
- Modell-Entwicklung
Das wissenschaftliche Planen von Experimenten auf Grund der von R.A. Fisher in der Agronomie entwickelten statistischen Techniken hat sich in allen experimentell arbeitenden Gebieten der Forschung und Entwicklung sehr bewährt und weitgehend durchgesetzt. Die Varianzanalyse bildet die entsprechende Auswertungsmethode. Sie ermöglicht es, die gemeinsame Wirkung verschiedener Faktoren auf eine interessierende Grösse zu beurteilen. Ziel der Versuchsplanung ist es, mit einer möglichst kleinen Zahl von Beobachtungen möglichst genaue Aussagen zu erhalten.
Der erste Teil behandelt die Grundideen und die einfachen Modelle.
Stichworte zum Inhalt:
- Grundgedanken der Versuchsplanung
- Ein- und Mehrweg-Varianzanalyse
- Blockbildung und einfache Versuchspläne
- Zufällige Effekte
Frühlingssemester Folgejahr (erste Semesterhälfte; in der zweiten Hälfte kann bei Interesse die für den DAS relevanten Teile besucht werden, siehe unten):
Kranke unterscheiden sich von Gesunden hinsichtlich verschiedener Merkmale. Kann man daraus Diagnose-Regeln ableiten? Die multivariate Statistik untersucht Zusammenhänge zwischen mehreren zufälligen Grössen. Ein Hauptziel ist die Identifikation von interessanten Strukturen in solchen Daten, die vielleicht zu neuen Erkenntnissen führen. Dazu werden oft Kombinationen von rechnerischen Verfahren und grafischen Mitteln eingesetzt, die rascher und klarer zu interpretieren sind als grosse Tabellen.
Im ersten Teil werden grafische Methoden und einfache Modelle gezeigt.
Stichworte zum Inhalt:
- Grafische Darstellungen, multivariate Normalverteilung
- Hauptkomponentenanlyse (PCA)
- Multidimensionale Skalierung (MDS)
- Clustering
Die Vorhersage der Zukunft hat die Menschheit seit jeher beschäftigt. Das Wetter oder die Aktienkurse von morgen hängen u.a. mit den Werten von heute zusammen. Zeitreihen-Modelle berücksichtigen die Korrelation aufeinanderfolgender Werte und ermöglichen dadurch unter anderem genauere Prognosen zukünftiger Werte.
Der erste Teil führt die grundlegenden Begriffe der zeitlichen Abhängigkeit und eine Klasse von Modellen zu ihrer Beschreibung ein.
Stichworte zum Inhalt:
- Zerlegung von Zeitreihen in Trend, zyklische Komponente und Rest
- (Partielle) Autokorrelation
- Autoregressive Modelle
- ARMA-Modelle
Aufbauteil (DAS)
Nach erfolgreichem Abschluss des CAS kann zur Erreichung des DAS aus dem folgenden Angebot des Aufbauteils frei ausgewählt werden (siehe auch die Auflistung der entsprechenden Kreditpunkte):
Ein grosses Angebot an Blockkursen behandelt einerseits allgemein anwendbare Konzepte und Methoden und andererseits Themen, deren Bedeutung sich vor allem in naturwissenschaftlichen und medizinischen, in sozialwissenschaftlichen oder ökonomischen Anwendungen zeigt.
Folgende Themen sind vorgesehen:
Allgemeine Methoden
- Nichtparametrische und Resampling Methoden (Rang-Methoden, Randomisierungstests, Bootstrap)
- Robuste Methoden
- Nichtlineare Regression
- Nichtparametrische Regression (Glättung)
- Bayesianische Statistik
Spezielle Themen
- Hochdimensionale Statistik
- Deep Learning
- Stichproben-Erhebungen
- Survival Analysis
- Räumliche Statistik
- Wiederholte Messungen (Repeated Measures)
- Statistische Analyse von Finanzdaten
Gewisse Blockkurse werden nur bei genügendem Bedarf angeboten, soweit geeignete Dozierende gefunden werden können.
Im zweiten Teil der Vorlesung werden die sogenannten verallgemeinerten linearen Modelle eingeführt, die für verschiedene Arten von Zielgrössen geeignet sind.
Stichworte zum Inhalt:
- Logistische Regression
- Poisson-Regression
- Verallgemeinerte Lineare Modelle
- Geordnete Zielgrössen
- Kategorielle Zielgrössen
- Allgemeine Modelle
Begleitend findet der Workshop statt. Gegen Ende des DAS wird typischerweise die Diplomarbeit geschrieben: