Test t Studenta – Wikipedia, wolna encyklopedia
Test t Studenta – test statystyczny używany do porównywania dwóch średnich lub porównywania średniej z próby z pewną założoną wartością i sprawdzania, czy różnice pomiędzy nimi mogą być wynikiem losowości. Test t Studenta korzysta ze statystyki testowej o rozkładzie t.
Zasada działania
[edytuj | edytuj kod]Jeśli próba losowa pochodzi z populacji o rozkładzie normalnym, to średnia z próby również ma rozkład normalny z taką samą jak w populacji wartością oczekiwaną. Różnica średniej z próby i średniej z populacji dzielona przez błąd standardowy średniej (iloraz odchylenia standardowego z populacji i pierwiastka z liczebności próby) ma standaryzowany rozkład normalny. Odchylenie standardowe w populacji nie jest jednak zwykle znane. Jeśli zastąpimy je odchyleniem z próby, uzyskamy rozkład t, który zbiega do rozkładu normalnego wraz ze wzrostem wielkości próby[1].
Test jednej średniej
[edytuj | edytuj kod]Hipoteza zerowa. Oznaczmy średnią z próby symbolem a wariancję z próby – symbolem W ramach testu jednej średniej weryfikuje się hipotezę zerową, że średnia rozkładu, z którego pobierana jest próbka o liczebności jest równa pewnej liczbie Jeżeli ta hipoteza zerowa jest prawdziwa, statystyka T, dana wzorem
ma rozkład t z stopniami swobody.
Formy hipotezy alternatywnej. Hipoteza alternatywna może przyjąć formę dwustronną (średnia w populacji nie jest równa ) lub formę jednostronną: lewostronną () lub prawostronną ()[2]. Podobnie jak w innych podobnych testach, w zależności od formy hipotezy alternatywnej oraz przyjętego poziomu istotności wyznacza się obszar krytyczny lub wartość p.
Kryterium decyzyjne. Analogicznie do wielu innych testów statystycznych, jeżeli uzyskana w próbie wartość statystyki testowej T znajdzie się w obszarze krytycznym lub (co jest równoważne) wartość p nie przekroczy , hipoteza zerowa jest odrzucana.
Założenia. Zakłada się, szczególnie w przypadku małych prób (np. [2]), że rozkład w populacji, z której pobiera się próbę losową, ma w przybliżeniu rozkład normalny.
Test dwóch średnich
[edytuj | edytuj kod]Hipoteza zerowa. W przypadku testu dwóch średnich porównywane są średnie z dwóch prób o liczebnościach i pochodzących z dwóch populacji. Hipoteza zerowa zwykle zakłada równość dwóch średnich w populacjach (), co jest równoznaczne stwierdzeniu, że różnica pomiędzy tymi średnimi wynosi zero (). Konstrukcja testu pozwala również na niezerową wartość różnicy w hipotezie zerowej (), w praktyce najczęściej jednak
Hipoteza alternatywna. Hipoteza alternatywna może być, podobnie jak w teście jednej średniej, dwustronna lewostronna () lub prawostronna ().
Statystyka testowa dana jest wzorem[3]:
,
gdzie i to średnia i wariancja w pierwszej próbie, a i to analogiczne statystyki z drugiej próby, ma rozkład t o stopniach swobody.
Założenia. Przeprowadzając test, zakłada się, że rozkłady w populacjach są w przybliżeniu normalne. Jest to ważne w przypadku małych prób, ponieważ dla większych prób test jest odporny na umiarkowane odstępstwa od tego założenia. Test wymaga ponadto założenia o równości wariancji w obu populacjach. Podobny test umożliwiający pominięcie założenia o równości wariancji nazywany jest testem t Welcha.
Test różnicy średnich dla obserwacji powiązanych w pary. Jeżeli obserwacje z dwóch populacji można powiązać w pary (na przykład testujemy zużycie paliwa wylosowanych samochodów w jeździe miejskiej i poza miastem albo umiejętności uczestników szkoleń przed i po szkoleniu), należy obliczyć różnice dla każdej pary i na tak przygotowanych danych (na obliczonych różnicach) przeprowadzić test jednej średniej[3].
Przypisy
[edytuj | edytuj kod]- ↑ Jacek Koronacki , Jan Mielniczuk , Statystyka dla studentów kierunków technicznych i przyrodniczych, Wyd. 3, Warszawa: Wydawnictwa Naukowo-Techniczne, 2006, s. 201-202, ISBN 978-83-204-3242-8 [dostęp 2024-05-07] .
- ↑ a b Anna Baranowska , Elementy statystyki dla studentów uczelni medycznych: nowoczesne ujęcie z opisem obliczeń w programach Excel, R i Statistica, Wydanie drugie poprawione, Wrocław: Oficyna Wydawnicza GiS, 2022, ISBN 978-83-67234-02-3 [dostęp 2024-05-07] .
- ↑ a b Andrzej Stanisz , Przystępny kurs statystyki z zastosowaniem Statistica PL na przykładach z medycyny. T. 1: Statystyki podstawowe, Wyd. 3 zm. i popr, Kraków: StatSoft Polska, 2006, s. 224-225, ISBN 978-83-88724-18-3 [dostęp 2024-04-22] (pol.).