Struktur

Übersicht

Der Kurs beginnt mit dem Einführungsteil, in dem die Grundlagen in Wahrscheinlichkeitsrechnung und Statistik nochmals repetiert werden. Zusätzlich gibt es für Kursteilnehmende, die bis anhin nicht mit R gearbeitet haben, eine Einführung in R (fakultativ). Mehr Details zu den Kursen findet man unten.

Nach dem Einführungsteil werden im Grundlagenteil in zwei Semestern jeweils der erste Teil von Vorlesungen über die allgemeinen Konzepte der Themenbereiche

  • Regression
  • Varianzanalyse und Versuchsplanung
  • Multivariate Statistik
  • Zeitreihenanalyse

besucht. Damit ist das CAS abgeschlossen. Mehr Details zu den Kursen findet man unten.

Nach erfolgreichem Abschluss des CAS kann zur Erreichung des DAS aus dem breiten Angebot des Aufbauteils frei ausgewählt werden. Zudem wird im Rahmen des Workshops ein Problem aus dem eigenen Arbeitsgebiet vorgestellt und die Diplomarbeit geschrieben.

Alle Details dazu findet man unten.

Details

Einführungsteil (CAS)

Zeit: April - Ende Juni / Anfangs Juli (genaue Daten sind hier aufgelistet)

Im Einführungsteil werden die Grundlagen nochmals repetiert und (fakultativ) eine Einführung in R angeboten:

Wenn beispielsweise die Zahl der Diebstähle von einem Jahr zum nächsten zunimmt, stellt sich die Frage, ob dies auf eine Änderung der Verhaltensweise zurückzuführen sei, oder ob es sich dabei um eine "zufällige Schwankung" handle. Um solche Fragen zu beantworten, braucht man ein Modell für den Zufall - das Modell der Wahrscheinlichkeiten.

Die Schliessende Statistik schlägt eine Brücke zwischen den Modellen der Wahrscheinlichkeitstheorie und den Daten. Sie hilft, zwischen "echten" (systematischen) und zufälligen Änderungen zu unterscheiden, sowie die Genauigkeit von Durchschnitten, Trends und anderen aus den Daten ausgerechneten Grössen anzugeben.

Die Teilnehmenden sollten diese Überlegungen bereits kennen. Dieser Teil ist als Repetition zu verstehen und bildet die Grundlage für die weiteren Teile.

Stichworte zum Inhalt:

  • Wahrscheinlichkeit
  • Zufallsvariable und Verteilungen
  • Verteilung von Funktionen einer oder mehrerer Zufallsvariablen
  • Summen von Zufallsvariablen und Grenzwertsätze
  • Schätzungen
  • Tests
  • Vertrauensintervalle
  • Statistik für eine und zwei Stichproben

Einführung in das Arbeiten mit der Software R, insbesondere

  • Datenimport
  • Datenmanipulation
  • Datenvisualisierung
  • Anwendung der gelernten statistischen Modellen

 

Grundlagenteil (CAS)

Im Grundlagenteil wird in zwei Semestern jeweils der erste Teil von 4 Vorlesungen besucht:

Herbstsemester (erste Semesterhälfte; in der zweiten Hälfte kann bei Interesse die für den DAS relevanten Teile besucht werden, siehe unten):  

In der Regression geht es darum, Modelle zu entwickeln, um die Werte eines Merkmals, durch die Werte mehrerer anderer Grössen zu erklären oder auch vorherzusagen. Die Problemstellungen sind so vielfältig, dass die Regression als die am weitesten verbreitete statistische Methodik gelten darf.

Der erste Teil beschränkt sich auf die einfache und multiple lineare Regression und vermittelt die Denkweise der explorativen Modell-Entwicklung, die auch für andere statistische Gebiete grundlegend ist.

Stichworte zum Inhalt:

  • Modelle der einfachen und der multiplen linearen Regression
  • Residuen-Analyse
  • Modell-Entwicklung

Das wissenschaftliche Planen von Experimenten auf Grund der von R.A. Fisher in der Agronomie entwickelten statistischen Techniken hat sich in allen experimentell arbeitenden Gebieten der Forschung und Entwicklung sehr bewährt und weitgehend durchgesetzt. Die Varianzanalyse bildet die entsprechende Auswertungsmethode. Sie ermöglicht es, die gemeinsame Wirkung verschiedener Faktoren auf eine interessierende Grösse zu beurteilen. Ziel der Versuchsplanung ist es, mit einer möglichst kleinen Zahl von Beobachtungen möglichst genaue Aussagen zu erhalten.

Der erste Teil behandelt die Grundideen und die einfachen Modelle.

Stichworte zum Inhalt:

  • Grundgedanken der Versuchsplanung
  • Ein- und Mehrweg-Varianzanalyse
  • Blockbildung und einfache Versuchspläne
  • Zufällige Effekte

Frühlingssemester Folgejahr (erste Semesterhälfte; in der zweiten Hälfte kann bei Interesse die für den DAS relevanten Teile besucht werden, siehe unten):

Kranke unterscheiden sich von Gesunden hinsichtlich verschiedener Merkmale. Kann man daraus Diagnose-Regeln ableiten? Die multivariate Statistik untersucht Zusammenhänge zwischen mehreren zufälligen Grössen. Ein Hauptziel ist die Identifikation von interessanten Strukturen in solchen Daten, die vielleicht zu neuen Erkenntnissen führen. Dazu werden oft Kombinationen von rechnerischen Verfahren und grafischen Mitteln eingesetzt, die rascher und klarer zu interpretieren sind als grosse Tabellen.

Im ersten Teil werden grafische Methoden und einfache Modelle gezeigt.

Stichworte zum Inhalt:

  • Grafische Darstellungen, multivariate Normalverteilung
  • Hauptkomponentenanlyse (PCA)
  • Multidimensionale Skalierung (MDS)
  • Clustering

Die Vorhersage der Zukunft hat die Menschheit seit jeher beschäftigt. Das Wetter oder die Aktienkurse von morgen hängen u.a. mit den Werten von heute zusammen. Zeitreihen-Modelle berücksichtigen die Korrelation aufeinanderfolgender Werte und ermöglichen dadurch unter anderem genauere Prognosen zukünftiger Werte.

Der erste Teil führt die grundlegenden Begriffe der zeitlichen Abhängigkeit und eine Klasse von Modellen zu ihrer Beschreibung ein.

Stichworte zum Inhalt:

  • Zerlegung von Zeitreihen in Trend, zyklische Komponente und Rest
  • (Partielle) Autokorrelation
  • Autoregressive Modelle
  • ARMA-Modelle

Aufbauteil (DAS)

Nach erfolgreichem Abschluss des CAS kann zur Erreichung des DAS aus dem folgenden Angebot des Aufbauteils frei ausgewählt werden (siehe auch die Auflistung der entsprechenden Kreditpunkte):

Ein grosses Angebot an Blockkursen behandelt einerseits allgemein anwendbare Konzepte und Methoden und andererseits Themen, deren Bedeutung sich vor allem in naturwissenschaftlichen und medizinischen, in sozialwissenschaftlichen oder ökonomischen Anwendungen zeigt.

Folgende Themen sind vorgesehen:

Allgemeine Methoden

  • Nichtparametrische und Resampling Methoden (Rang-Methoden, Randomisierungstests, Bootstrap)
  • Robuste Methoden
  • Nichtlineare Regression
  • Nichtparametrische Regression (Glättung)
  • Bayesianische Statistik

Spezielle Themen

  • Hochdimensionale Statistik
  • Deep Learning
  • Stichproben-Erhebungen
  • Survival Analysis
  • Räumliche Statistik
  • Wiederholte Messungen (Repeated Measures)
  • Statistische Analyse von Finanzdaten

Gewisse Blockkurse werden nur bei genügendem Bedarf angeboten, soweit geeignete Dozierende gefunden werden können.

Zusätzlich können auch die zweiten Teile der Vorlesungen, die schon während des CAS besucht werden, belegt werden:

Im zweiten Teil der Vorlesung werden die sogenannten verallgemeinerten linearen Modelle eingeführt, die für verschiedene Arten von Zielgrössen geeignet sind.

Stichworte zum Inhalt:

  • Logistische Regression
  • Poisson-Regression
  • Verallgemeinerte Lineare Modelle
  • Geordnete Zielgrössen
  • Kategorielle Zielgrössen
  • Allgemeine Modelle

Im zweiten Teil werden gemischte Modelle - mit festen und zufälligen Effekten - und anspruchsvollere Versuchspläne behandelt.

Stichworte zum Inhalt:

  • Mixed Models
  • Split-Plot Modelle
  • Unvollständige Blockversuche

Der zweite Teil behandelt anspruchsvollere Methoden und weiterführende Modelle.

Stichworte zum Inhalt:

  • Random Forest
  • Lasso und Ridge Regression
  • Lineare Diskriminanzanalyse (LDA) / Quadratische Diskriminanzanalyse (QDA)
  • Faktoranalyse
  • Missing Data
  • Bagging / Boosting
  • Kausalität

Im zweiten Teil werden weitere Modelle und die in den Ingenieurwissenschaften grundlegende Spektralanalyse erarbeitet.

Stichworte zum Inhalt:

  • Regression mit Zeitreihen
  • Spektralanalyse
  • Zustandsraum-Modelle
  • Weiterführende Modelle

Begleitend findet der Workshop statt. Gegen Ende des DAS wird typischerweise die Diplomarbeit geschrieben:

Im Workshop präsentieren die Teilnehmenden des DAS im Rahmen eines ca. 30 minütigen Vortrags eine statistische Fragestellung aus ihrem Tätigkeitsgebiet.

Typischerweise gegen Ende des DAS bearbeiten die Teilnehmenden des DAS eine Diplomarbeit, in der normalerweise Daten aus den eigenen Tätigkeitsbereich ausgewertet werden. Die Arbeit soll etwa 1 - 2 Wochen Zeitaufwand beanspruchen.  

JavaScript has been disabled in your browser