Exempel på ett permutationstest

click fraud protection

En fråga som det alltid är viktigt att ställa in statistik är, "Är det observerade resultatet på grund av en slump, eller är det statistiskt säkerställt?” En klass av hypotestest, kallad permutationstest, låt oss testa denna fråga. Översikten och stegen i ett sådant test är:

  • Vi delade våra ämnen i en kontrollgrupp och en experimentell grupp. Nollhypotesen är att det inte finns någon skillnad mellan dessa två grupper.
  • Tillämpa en behandling på den experimentella gruppen.
  • Mät svaret på behandlingen
  • Tänk på varje möjlig konfiguration av den experimentella gruppen och det observerade svaret.
  • Beräkna ett p-värde baserat på vårt observerade svar relativt alla potentiella experimentgrupper.

Detta är en översikt av en permutation. För att beskriva denna översikt kommer vi att spendera tid på att titta på ett genomarbetat exempel på ett sådant permutationstest i detalj.

Exempel

Anta att vi studerar möss. I synnerhet är vi intresserade av hur snabbt mössen slutför en labyrint som de aldrig har stött på tidigare. Vi vill tillhandahålla bevis för en experimentell behandling. Målet är att visa att möss i behandlingsgruppen löser labyrinten snabbare än obehandlade möss.

instagram viewer

Vi börjar med våra ämnen: sex möss. För enkelhets skull kommer musen att hänvisas till med bokstäverna A, B, C, D, E, F. Tre av dessa möss ska väljas slumpmässigt för den experimentella behandlingen, och de andra tre placeras i en kontrollgrupp där försökspersonerna får placebo.

Därefter väljer vi slumpmässigt i vilken ordning mössen väljs för att köra labyrinten. Tiden för att avsluta labyrinten för alla möss kommer att noteras, och ett medelvärde för varje grupp kommer att beräknas.

Anta att vårt slumpmässiga urval har möss A, C och E i den experimentella gruppen, med de andra mössen i placebo kontrollgrupp. Efter att behandlingen har genomförts väljer vi slumpmässigt ordningen för mössen att springa genom labyrinten.

Körtiden för var och en av mössen är:

  • Mus A kör loppet på 10 sekunder
  • Mus B kör loppet på 12 sekunder
  • Mus C kör loppet på 9 sekunder
  • Mus D kör loppet på 11 sekunder
  • Mus E kör loppet på 11 sekunder
  • Mus F kör loppet på 13 sekunder.

Den genomsnittliga tiden för att slutföra labyrinten för mössen i den experimentella gruppen är 10 sekunder. Den genomsnittliga tiden för att slutföra labyrinten för de i kontrollgruppen är 12 sekunder.

Vi kan ställa ett par frågor. Är behandlingen verkligen orsaken till den snabbare genomsnittliga tiden? Eller var vi bara tur i vårt val av kontroll- och experimentgrupp? Behandlingen kan ha haft ingen effekt och vi valde slumpmässigt de långsammare mössen för att få placebo och snabbare möss för att få behandlingen. Ett permutationstest hjälper till att besvara dessa frågor.

hypoteser

Hypoteserna för vårt permutationstest är:

  • De nollhypotesen är uttalandet om ingen effekt. För detta specifika test har vi H0: Det finns ingen skillnad mellan behandlingsgrupper. Medeltiden för att köra labyrinten för alla möss utan behandling är densamma som medeltiden för alla möss med behandlingen.
  • Den alternativa hypotesen är vad vi försöker fastställa bevis till förmån för. I det här fallet skulle vi ha Hen: Medeltiden för alla möss med behandlingen är snabbare än medeltiden för alla möss utan behandlingen.

permutationer

Det finns sex möss, och det finns tre platser i den experimentella gruppen. Detta betyder att antalet möjliga experimentgrupper ges med antalet kombinationer C (6,3) = 6! / (3! 3!) = 20. De återstående individerna skulle ingå i kontrollgruppen. Så det finns 20 olika sätt att slumpmässigt välja individer i våra två grupper.

Tilldelningen av A, C och E till den experimentella gruppen gjordes slumpmässigt. Eftersom det finns 20 sådana konfigurationer har den specifika med A, C och E i den experimentella gruppen en sannolikhet på 1/20 = 5% som inträffar.

Vi måste bestämma alla 20 konfigurationer av den experimentella gruppen för individerna i vår studie.

  1. Experimentell grupp: A B C och kontrollgrupp: D E F
  2. Experimentell grupp: A BD och kontrollgrupp: C E F
  3. Experimentell grupp: A BE- och kontrollgrupp: C DF
  4. Experimentell grupp: A BF- och kontrollgrupp: CDE
  5. Experimentell grupp: A CD och kontrollgrupp: B E F
  6. Experimentell grupp: A CE och kontrollgrupp: B D F
  7. Experimentell grupp: A CF- och kontrollgrupp: B D E
  8. Experimentell grupp: A D E och kontrollgrupp: B C F
  9. Experimentell grupp: A DF- och kontrollgrupp: B CE
  10. Experimentell grupp: A E F- och kontrollgrupp: B C D
  11. Experimentell grupp: B CD och kontrollgrupp: A E F
  12. Experimentell grupp: B CE och Kontrollgrupp: A D F
  13. Experimentell grupp: B C F och kontrollgrupp: A D E
  14. Experimentell grupp: B D E och Kontrollgrupp: A C F
  15. Experimentell grupp: B DF och Kontrollgrupp: A C E
  16. Experimentell grupp: B E F och Kontrollgrupp: A C D
  17. Experimentell grupp: CDE och kontrollgrupp: A B F
  18. Experimentell grupp: C DF och kontrollgrupp: A B E
  19. Experimentell grupp: CEF och kontrollgrupp: A B D
  20. Experimentell grupp: D E F och Kontrollgrupp: A B C

Vi tittar sedan på varje konfiguration av experimentella och kontrollgrupper. Vi beräknar medelvärdet för var och en av de 20 permutationerna i listan ovan. För det första har A, B och C tider på respektive 10, 12 respektive 9. Medelvärdet för dessa tre siffror är 10.3333. I denna första permutation har D, E och F tider på 11, 11 respektive 13. Detta har i genomsnitt 11.6666.

Efter beräkningen av medelvärde för varje grupp, beräknar vi skillnaden mellan dessa medel. Var och en av följande motsvarar skillnaden mellan de experimentella och kontrollgrupperna som anges ovan.

  1. Placebo - Behandling = 1,333333333 sekunder
  2. Placebo - Behandling = 0 sekunder
  3. Placebo - Behandling = 0 sekunder
  4. Placebo - Behandling = -1.333333333 sekunder
  5. Placebo - Behandling = 2 sekunder
  6. Placebo - Behandling = 2 sekunder
  7. Placebo - Behandling = 0.666666667 sekunder
  8. Placebo - Behandling = 0.666666667 sekunder
  9. Placebo - Behandling = -0.666666667 sekunder
  10. Placebo - Behandling = -0.666666667 sekunder
  11. Placebo - Behandling = 0.666666667 sekunder
  12. Placebo - Behandling = 0.666666667 sekunder
  13. Placebo - Behandling = -0.666666667 sekunder
  14. Placebo - Behandling = -0.666666667 sekunder
  15. Placebo - Behandling = -2 sekunder
  16. Placebo - Behandling = -2 sekunder
  17. Placebo - Behandling = 1,333333333 sekunder
  18. Placebo - Behandling = 0 sekunder
  19. Placebo - Behandling = 0 sekunder
  20. Placebo - Behandling = -1.333333333 sekunder

P-värde

Nu rangordnar vi skillnaderna mellan medlen från varje grupp som vi noterade ovan. Vi tabellerar också procentandelen av våra 20 olika konfigurationer som representeras av varje skillnad i medel. Till exempel hade fyra av de 20 ingen skillnad mellan medlen för kontroll- och behandlingsgrupperna. Detta står för 20% av de 20 konfigurationer som anges ovan.

  • -2 för 10%
  • -1,33 för 10%
  • -0,667 för 20%
  • 0 för 20%
  • 0,667 för 20%
  • 1,33 för 10%
  • 2 för 10%.

Här jämför vi denna lista med vårt observerade resultat. Vårt slumpmässiga urval av möss för behandlings- och kontrollgrupperna resulterade i en genomsnittlig skillnad på 2 sekunder. Vi ser också att denna skillnad motsvarar 10% av alla möjliga prover. Resultatet är att för denna studie har vi en p-värde av 10%.

instagram story viewer