Test t Studenta – Wikipedia, wolna encyklopedia

Test t Studenta – test statystyczny używany do porównywania dwóch średnich lub porównywania średniej z próby z pewną założoną wartością i sprawdzania, czy różnice pomiędzy nimi mogą być wynikiem losowości. Test t Studenta korzysta ze statystyki testowej o rozkładzie t.

Zasada działania

Jeśli próba losowa pochodzi z populacji o rozkładzie normalnym, to średnia z próby również ma rozkład normalny z taką samą jak w populacji wartością oczekiwaną. Różnica średniej z próby i średniej z populacji dzielona przez błąd standardowy średniej (iloraz odchylenia standardowego z populacji i pierwiastka z liczebności próby) ma standaryzowany rozkład normalny. Odchylenie standardowe w populacji nie jest jednak zwykle znane. Jeśli zastąpimy je odchyleniem z próby, uzyskamy rozkład t, który zbiega do rozkładu normalnego wraz ze wzrostem wielkości próby^[1].

Test jednej średniej

Hipoteza zerowa. Oznaczmy średnią z próby symbolem ${\bar {X}},$ a wariancję z próby – symbolem $S^{2}.$ W ramach testu jednej średniej weryfikuje się hipotezę zerową, że średnia rozkładu, z którego pobierana jest próbka o liczebności $n,$ jest równa pewnej liczbie $\mu _{0}.$ Jeżeli ta hipoteza zerowa jest prawdziwa, statystyka T, dana wzorem

T={\frac {{\overline {X}}-\mu _{0}}{S}}{\sqrt {n}}

ma rozkład t z $n-1$ stopniami swobody.

Formy hipotezy alternatywnej. Hipoteza alternatywna może przyjąć formę dwustronną $\mu \neq \mu _{0}$ (średnia w populacji nie jest równa $\mu _{0}$ ) lub formę jednostronną: lewostronną ( $\mu <\mu _{0}$ ) lub prawostronną ( $\mu >\mu _{0}$ )^[2]. Podobnie jak w innych podobnych testach, w zależności od formy hipotezy alternatywnej oraz przyjętego poziomu istotności $\alpha$ wyznacza się obszar krytyczny lub wartość p.

Kryterium decyzyjne. Analogicznie do wielu innych testów statystycznych, jeżeli uzyskana w próbie wartość statystyki testowej T znajdzie się w obszarze krytycznym lub (co jest równoważne) wartość p nie przekroczy $\alpha$ , hipoteza zerowa jest odrzucana.

Założenia. Zakłada się, szczególnie w przypadku małych prób (np. $n\leq 30$ ^[2]), że rozkład w populacji, z której pobiera się próbę losową, ma w przybliżeniu rozkład normalny.

Test dwóch średnich

Hipoteza zerowa. W przypadku testu dwóch średnich porównywane są średnie z dwóch prób o liczebnościach $n_{1}$ i $n_{2}$ pochodzących z dwóch populacji. Hipoteza zerowa zwykle zakłada równość dwóch średnich w populacjach ( $\mu _{1}=\mu _{2}$ ), co jest równoznaczne stwierdzeniu, że różnica pomiędzy tymi średnimi wynosi zero ( $\mu _{1}-\mu _{2}=0$ ). Konstrukcja testu pozwala również na niezerową wartość różnicy w hipotezie zerowej ( $\mu _{1}-\mu _{2}=D_{0}$ ), w praktyce najczęściej jednak $D_{0}=0.$

Hipoteza alternatywna. Hipoteza alternatywna może być, podobnie jak w teście jednej średniej, dwustronna $\mu _{1}-\mu _{2}\neq D_{0}$ lewostronna ( $\mu _{1}-\mu _{2}<D_{0}$ ) lub prawostronna ( $\mu _{1}-\mu _{2}>D_{0}$ ).

Statystyka testowa dana jest wzorem^[3]:

$T={\frac {{\overline {X}}_{1}-{\overline {X}}_{2}-D_{0}}{\sqrt {{\frac {(n_{1}-1)S_{1}^{2}+(n_{2}-1)S_{2}^{2}}{n_{1}+n_{2}-2}}\left({\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}\right)}}}$ ,

gdzie ${\overline {X}}_{1}$ i $S_{1}^{2}$ to średnia i wariancja w pierwszej próbie, a ${\overline {X}}_{2}$ i $S_{2}^{2}$ to analogiczne statystyki z drugiej próby, ma rozkład t o $n_{1}+n_{2}-2$ stopniach swobody.

Założenia. Przeprowadzając test, zakłada się, że rozkłady w populacjach są w przybliżeniu normalne. Jest to ważne w przypadku małych prób, ponieważ dla większych prób test jest odporny na umiarkowane odstępstwa od tego założenia. Test wymaga ponadto założenia o równości wariancji w obu populacjach. Podobny test umożliwiający pominięcie założenia o równości wariancji nazywany jest testem t Welcha.

Test różnicy średnich dla obserwacji powiązanych w pary. Jeżeli obserwacje z dwóch populacji można powiązać w pary (na przykład testujemy zużycie paliwa wylosowanych samochodów w jeździe miejskiej i poza miastem albo umiejętności uczestników szkoleń przed i po szkoleniu), należy obliczyć różnice dla każdej pary i na tak przygotowanych danych (na obliczonych różnicach) przeprowadzić test jednej średniej^[3].

Przypisy

↑ JacekJ. Koronacki JacekJ., JanJ. Mielniczuk JanJ., Statystyka dla studentów kierunków technicznych i przyrodniczych, Wyd. 3, Warszawa: Wydawnictwa Naukowo-Techniczne, 2006, s. 201-202, ISBN 978-83-204-3242-8 [dostęp 2024-05-07] .
↑ ^a ^b AnnaA. Baranowska AnnaA., Elementy statystyki dla studentów uczelni medycznych: nowoczesne ujęcie z opisem obliczeń w programach Excel, R i Statistica, Wydanie drugie poprawione, Wrocław: Oficyna Wydawnicza GiS, 2022, ISBN 978-83-67234-02-3 [dostęp 2024-05-07] .
↑ ^a ^b AndrzejA. Stanisz AndrzejA., Przystępny kurs statystyki z zastosowaniem Statistica PL na przykładach z medycyny. T. 1: Statystyki podstawowe, Wyd. 3 zm. i popr, Kraków: StatSoft Polska, 2006, s. 224-225, ISBN 978-83-88724-18-3 [dostęp 2024-04-22] (pol.).

[1] JacekJ. Koronacki JacekJ., JanJ. Mielniczuk JanJ., Statystyka dla studentów kierunków technicznych i przyrodniczych, Wyd. 3, Warszawa: Wydawnictwa Naukowo-Techniczne, 2006, s. 201-202, ISBN 978-83-204-3242-8 [dostęp 2024-05-07] .

[:3-2] AnnaA. Baranowska AnnaA., Elementy statystyki dla studentów uczelni medycznych: nowoczesne ujęcie z opisem obliczeń w programach Excel, R i Statistica, Wydanie drugie poprawione, Wrocław: Oficyna Wydawnicza GiS, 2022, ISBN 978-83-67234-02-3 [dostęp 2024-05-07] .

[:2-3] AndrzejA. Stanisz AndrzejA., Przystępny kurs statystyki z zastosowaniem Statistica PL na przykładach z medycyny. T. 1: Statystyki podstawowe, Wyd. 3 zm. i popr, Kraków: StatSoft Polska, 2006, s. 224-225, ISBN 978-83-88724-18-3 [dostęp 2024-04-22] (pol.).

[1]

[2]

[3]