Code Beispiele für Woche 8

Überarbeitete Markdown-Dokumentation für den Chi-Quadrat-Unabhängigkeitstest

\({\chi}^2\)-Unabhängigkeitstest in R

Was testen wir?

Mit dem \({\chi}^2\)-Unabhängigkeitstest untersuchen wir, ob zwischen zwei kategorialen Variablen eine statistische Unabhängigkeit besteht.

Null- und Alternativhypothese

Nullhypothese (H0): Die beiden Variablen sind unabhängig.
Alternativhypothese (H1): Die beiden Variablen sind nicht unabhängig.

R-Befehl für den \({\chi}^2\)-Unabhängigkeitstest

Der chisq.test-Befehl in R kann verwendet werden, um die Unabhängigkeit zwischen zwei kategorialen Variablen zu testen. Dies kann entweder durch die Bereitstellung einer Kontingenztabelle der Daten oder direkt durch zwei Vektoren, die die kategorialen Daten repräsentieren, erfolgen.

Beispiel mit einer Kontingenztabelle

# Kontingenztabelle erstellen
meineTabelle <- matrix(c(25, 30, 20, 25), nrow = 2,
                       dimnames = list(Geschlecht = c("Männlich", "Weiblich"),
                                       Präferenz = c("Marke A", "Marke B")))
# Chi-Quadrat-Unabhängigkeitstest durchführen
chisq.test(meineTabelle)

Es ist auch möglich, chisq.test direkt mit zwei Vektoren durchzuführen, welche die beobachteten Kategorien für jede Beobachtung darstellen. Dies ist besonders nützlich, wenn Sie Ihre Daten bereits in einem tabellarischen Format vorliegen haben.

Bewertung des p-Wertes

Der p-Wert hilft uns zu entscheiden, ob wir die Nullhypothese ablehnen oder nicht.

Niedriger p-Wert (< 0,05): Es gibt ausreichende Beweise, um die Nullhypothese abzulehnen, was darauf hinweist, dass ein signifikanter Zusammenhang zwischen den Variablen besteht.
Hoher p-Wert (≥ 0,05): Es gibt nicht genügend Beweise, um die Nullhypothese abzulehnen, was darauf hindeutet, dass die Variablen unabhängig voneinander sein könnten.

Die Interpretation des p-Wertes hängt von der gewählten Signifikanzschwelle ab, wobei 0,05 eine häufig verwendete Schwelle ist. Ein hoher p-Wert bedeutet nicht, dass die Variablen unbedingt unabhängig sind, sondern dass wir nicht genügend Beweise haben, um ihre Abhängigkeit statistisch nachzuweisen.

Kolmogorov-Smirnov-Test in R

Was testen wir?

Der Kolmogorov-Smirnov-Test wird verwendet, um zu überprüfen, ob zwei Stichproben aus derselben Verteilung stammen.

One-Sided und Two-Sided Test

One-Sided Test: Überprüft, ob eine Stichprobenverteilung stochastisch kleiner oder größer als die andere ist.
Two-Sided Test: Überprüft, ob es einen Unterschied in den Verteilungen gibt, ohne die Richtung des Unterschieds zu spezifizieren.

Null- und Alternativhypothese

Nullhypothese (H0): Beide Stichproben stammen aus derselben Verteilung.
Alternativhypothese (H1): Die Stichproben stammen aus unterschiedlichen Verteilungen.

R-Befehl

ks.test(Stichprobe1, Stichprobe2)