Test T-studenta nie taki straszny

t_student_zajawka
Analiza danych Statystyka Strefa studenta
2022-05-22

Jak to jest z tym testowaniem?

Statystyka do Ciebie nie przemawia? Testowanie statystyczne to dla Ciebie czarna magia? Dziś wyjaśnimy sobie, jak to jest z testowaniem o średniej. Zacznijmy od tego, jakie są możliwości. Skupimy się tylko na tych przykładach do liczenia „ręcznego”, czyli typowe uczelniane przykłady. 

W testowaniu statystycznym średnich na ogół opieramy się o rozkład t-studenta. Jest to rozkład empiryczny, więc kwantyle, kwartyle i ogólnie jego wartości zależą od liczby obserwacji. Nie da się tak po prostu policzyć jego wartości (przybliża się je), stąd też musimy sięgnąć do tablic. Jeżeli wszystko liczy za nas komputer, to oczywiście nie jest problemem znaleźć dowolną wartość z rozkładu t-studenta. Jeżeli jednak jesteśmy ograniczeni do testowania na kartce, a wszystko co posiadamy, to skromne tablice i kalkulator, nie wszystko możemy tak łatwo wyliczyć. Dlatego też przyjęto wartość graniczną pomiędzy małą próbką a dużą. Ta granica to 30, czyli jeżeli liczba obserwacji jest mniejsza niż 30, to masz małą próbkę, a jeżeli większa – dużą. Dla małej próbki rzeczywiście wykorzystuje się tablice t-studenta, a dla dużej (licząc na kartce) zazwyczaj wykorzystuje się rozkład normalny.

Dlaczego tak można? Otóż dlatego, że rozkład t – studenta jest bardzo zbliżony do rozkładu normalnego, a im większą mamy liczebność, tym ten rozkład jest bardziej podobny do normalnego. Uznaje się, że od n = 30 wartości w tych rozkładach na tyle mało się różnią, że można rozkład t przybliżać rozkładem normalnym. Oczywiście najlepiej nawet dla dużych jest korzystać z rozkładu t-studenta, jednak do tego potrzebujemy wsparcia od strony komputera (albo przynajmniej dobrych tablic).

O co chodzi z poziomem ufności/istotności? 

Zacznijmy od wyjaśnienia tych pojęć (sporo osób je myli)

  1. Poziom ufności – mówi o tym, jak bardzo możemy „zaufać” naszym wynikom, więc jest to duża wartość (uwzględniając fakt, że jest z przedziału (0,1), więc przez słowo duża rozumiemy bliską do wartości 1). Jest to 1-α. 
  2. Poziom istotności – mówi nam o tym na jak dużą pomyłkę sobie pozwalamy (na ile procent możemy się mylić). Jest to α.

Poziom ufności + poziom istotności = 1

Najczęściej (zwłaszcza w psychologicznych badaniach) przyjmuje się poziom istotności 0,05. Patrząc na to z nieco innej strony – będąc lekarzem raczej nie chciałbyś być pewny swoich wniosków jedynie na 95%. Statystyka jest bardzo często wykorzystywana w medycynie. Wtedy przyjmuje się bardzo niewielki poziom istotności np. 0,001 lub nawet mniejszy. 

Testowanie

Jeżeli chodzi o testowanie średnich, to mamy 3 możliwości zestawów hipotezy zerowej (H0) i alternatywnej (HA).

Czym one się różnią i skąd mamy wiedzieć której użyć? 

Przede wszystkim odwołując się do rozwiązywania zadań, treść (zazwyczaj) wyraźnie podaje, co ma być przetestowane. Popatrzmy na przykładowe zadanie:

Zadanie pochodzi z:
Zbiór zadań z rachunku prawdopodobieństwa i statystyki matematycznej – Wojciech Młocek, Kamila Piwowarczyk, Agnieszka Rutkowska

Tu treść wskazuje, że hipoteza alternatywna ma być taka jak w przypadku (2), bo chcemy (a właściwie to odbiorca L chce) udowodnić, że sprzedawane pręty są krótsze niż się zakłada, a skoro krótsze to chcemy pokazać, że rzeczywista długość (m) jest mniejsza niż długość założona (m0). Tu już mamy pierwszy wniosek – hipotezę alternatywną wybieramy tak, aby wskazywała na to co chcemy udowodnić. Po wybraniu hipotezy musimy obliczyć statystykę testową.

Mamy 3 możliwości wyboru statystyki:

Pierwszą z nich bierzemy, gdy znamy odchylenie – czyli wtedy, gdy treść zadania mówi nam wprost ile wynosi odchylenie (oznaczane jako σ) lub jest podane, że dane pochodzą z rozkładu normalnego o zadanym odchyleniu (np. N(m,1) – jest to rozkład normalny o średniej m i odchyleniu 1, zatem σ = 1). Wartość graniczną (o niej trochę niżej) w takim przypadku wyznaczamy przy pomocy rozkładu normalnego.

Z drugiej korzystamy, gdy nie znamy odchylenia (w treści zadania albo są tylko dane i sami liczymy odchylenie, albo jest podane odchylenie jako już wyliczone wcześniej (oznaczane zazwyczaj jako s)) oraz liczba obserwacji jest mniejsza niż 30. W tym przypadku wartości granicznej szukamy w rozkładzie t-studenta. 

Z ostatniej natomiast korzystamy, gdy mamy sytuację jak  w 2 przypadku, ale obserwacji jest więcej niż 30 i wartość graniczną wyznaczamy wtedy z rozkładu normalnego. 

Mamy już ustalony typ hipotezy alternatywnej i sposób liczenia statystyki testowej. Teraz musimy wyznaczyć  wartości graniczne, które pomogą nam podjąć decyzję:

Odrzucamy hipotezę zerową/nie ma podstaw, aby odrzucić hipotezę zerową. 

Jeżeli mamy alternatywę dwustronną (dwustronny obszar krytyczny), to do wyznaczenia wartości granicznej bierzemy kwartyl rzędu 1-alpha/2 oraz tę samą wartość z minusem (czyli kwartyl rzędu alpha/2). Wybieramy takie wartości, ponieważ część zamalowana na żólto (wykres poniżej) ma mieć pole równe apha (a pole pod całym wykresem gęstości wynosi 1! ). Wartość graniczna (lub wartości graniczne w przypadku dwustronnego obszaru krytycznego, to miejsca na osi X zaznaczone na czerwono na wykresie poniżej).

Źródło: https://quantup.pl/

W przypadku wyboru hipotezy alternatywnej jak w  (2) i (3) także musimy mieć pole pod wykresem (tam, gdzie zamalowane) równe alfa. Jak widać na powyższym wykresie dla alternatywy lewostronnej/prawostronnej zamalowane jest tylko z jednej strony, stąd też mamy odpowiednio kwantyle rzędu  α (lewostronny obszar krytyczny) i 1-α (prawostronny obszar krytyczny).

Jak odczytać kwantyle?

W przypadku, gdy nasza statystyka to „u” (patrz wyżej), to korzystamy z rozkładu normalnego. Jeżeli mamy np. poziom istotności równy 0,1 (α = 0,1) i test z alternatywą dwustronną (czyli szukamy kwantyla rzędu 1-α/2 (1-0,1/2 = 0,95), to szukamy (wewnątrz!) tablicy rozkładu normalnego wartości możliwie najbliższej 0,95 i odczytujemy kwanty w następujący sposób:

Czyli nasz szukany kwantyl wynosi 1,6 +0,05 = 1,65 i drugi poszukiwany to -1,65).

Dla lewostronnego obszaru krytycznego (wewnątrz tej tabeli nie znajdziemy wartości bliskiej 0,1) możemy wziąć kwantyl rzędu 1-α (1-0,1 = 0,9) i wziąć jego wartość z minusem. Odczytujemy, że jest to 1,29, więc poszukiwany kwanty wynosi -1,29. W przypadku prawostronnym jest to 1,29.

Jeżeli natomiast nasza statystyka to „t”, to korzystamy z rozkładu t – studenta. Jeżeli nie korzystamy z pomocy komputera to jesteśmy mocno ograniczeni. Prowadzący bardzo często dają tabelkę swoim studentom taką jak ta poniżej. Zauważmy, że aby z niej skorzystać musimy znać k i α (i żeby z nich skorzystać nasze wartości muszą się tam znajdować). „k” to tzw. stopnie swobody. Żeby wyliczyć je wystarczy wziąć liczbę obserwacji i odjąć jeden (n-1). Oczywiście α znamy, jako że jest to poziom ufności (zawsze podany w zadaniu).

Moim zdaniem tablice rozkładu t są dziwnie stworzone, ponieważ w przypadku alternatywy dwustronnej patrzymy na wartość α (a nie α/2 jak to było wcześniej) i UWAGA jeżeli mamy alternatywę jednostronną patrzymy na 2α i bierzemy tę wartość z plusem (prawostronna alternatywa) lub minusem (lewostronna alternatywa) lub w przypadku dwustronnej zarówno z plusem jak i minusem. Oczywiście oprócz  wartości alfa musimy także  wziąć pod uwagę   „k”. 

Dla α = 0,05 i powiedzmy 15 obserwacji (k= 15-1=14) jest to:

  1. W przypadku alternatywy dwustronnej liczba na przecięciu k = 14 i α = 0,05 (zaznaczone na czerwono) czyli mamy 2,145 i -2,145
  2. W przypadku alternatywy prawostronnej/lewostronnej liczba na przecięciu k = 14 i α = 0,1, czyli 1,761 (i taką wartość bierzemy dla prawostronnej), a dla lewostronnej jest to -1,761.

Ostatnim etapem jest sprawdzenie czy statystyka testowa leży w żółtej części (patrz wykres przedstawiający obszary krytyczne) czy w białej. Granicą pomiędzy białym a żółtym są wyznaczone wcześniej kwantyle. Jeżeli leży w żółtej części to odrzucamy hipotezę zerową, a jeżeli w białym, to nie ma podstaw, aby odrzucić H0.

Praktyka

Rozwiązanie zadania krok po kroku:

W pewnym biochemicznym doświadczeniu bada się czas życia żywych komórek w pewnym środowisku. Rozkład tego czasu można przyjąć za normalny. Dokonano 8 pomiarów i otrzymano następujące czasy życia tych komórek w badanym środowisku (w godz.): 4.7, 5.3, 4.0, 3.8, 6.2, 5.5, 4.5, 6.0. Przyjmując poziom istotności α  = 0, 05 sprawdzić hipotezę, że średni czas życia tych komórek w tym środowisku jest dłuższy niż 4 godziny. 

Zawsze zaczynamy od „wyciągnięcia” z treści przydatnych informacji. 

  • Poziom istotności: α  = 0, 05
  • Liczba obserwacji: n = 8
  • Punkt odniesienia do średniej: m0 = 4 (bo średnią długość życia przyrównujemy do tej właśnie liczby. Mówi nam o tym ostatnie zdanie).
  • Hipoteza alternatywna: prawostronna (bo chcemy sprawdzić, że czas życia jest dłuższy niż 4 godziny).

Kolejnym krokiem jest wybór statystyki testowej – nie mamy wprost podanych informacji, że znamy odchylenie. Liczba obserwacji, to 8. Wybieramy zatem statystykę testową:

Nie znamy s, więc musimy je policzyć.  Wykorzystuje się do tego jeden z dwóch wzorów:

Generalnie powinno się wykorzystywać ten drugi – nie chcę teraz wchodzić szczegóły dlaczego. W praktyce często prowadzący podają wersję, która z jakiegoś powodu bardziej im odpowiada, więc nie będę narzucać, co się powinno zrobić. Zalecam skorzystać ze wzoru, który podano wam na zajęciach.

Ja na potrzeby przykładu skorzystam z pierwszego wzoru. Pokażę też bardzo wygodną tabelkę do rozpisywania sobie takich obliczeń. 

Przypomnę też, że xi to są kolejne obserwacje, a x (z daszkiem) , to średnia z obserwacji. Jak popatrzymy na statystykę testową (u nas t – wypisane wyżej) oraz na rzeczy na początku wypisane jako znane, od razu wiemy, że potrzebujemy obliczyć średnią (x z daszkiem) i odchylenie (s), aby przeprowadzić test.

W pierwszej kolumnie tabeli wypisujemy wszystkie obserwacje (wartości podane w treści zadania). Policzymy ich sumę a następnie wykorzystamy ją do policzenia średniej.  

Jak już mamy średnią, to liczymy różnicę między wartością obserwacji a średnią, otrzymane wartosci podnosimy do kwadratu i liczymy ich sumę (tabelka poniżej).

Suma z trzeciej kolumny, to tak właściwie spora część wzoru który chcemy osiągnąć (zaznaczona na żółto)

Możemy w końcu policzyć statystykę testową:

Wyznaczmy sobie jeszcze wartość graniczną. Przypomnijmy, że przyjęty poziom istotności statystycznej wynosi 0,05 oraz mamy 8 obserwacji (czyli liczba stopni swobody „k” wynosi 8-1=7.)

Odczytujemy zatem z tablic rozkładu t-studenta wartość graniczną, która wynosi 1,895. Przypomnijmy, że do odczytania z tablic należało odczytać informację o 2 alfa, ponieważ mamy jednostronną alternatywę.

Po przygotowaniu wszystkich obliczeń możemy w końcu przejść do przeprowadzenia testu. 

Wartość graniczna (1,895) jest mniejsza niż wyliczona statystyka testowa (3,15). Oznacza to, że nasza statystyka testowa „wpada” w obszar odrzucenia (znajduje się w polu zaznaczonym na żółto), zatem odrzucamy hipotezę zerową. Tym samym przyjmujemy, że Hipoteza alternatywna jest prawdziwa. 

Wniosek z zadania / odpowiedź do zadania: Średni czas życia tych komórek w tym środowisku jest dłuższy niż 4 godziny.

Subskrybuj
Powiadom o
guest
0 komentarzy
Zobacz wszystkie komentarze