Huvudkomponenter och faktoranalys

Huvudkomponentanalys (PCA) och faktoranalys (FA) är statistiska tekniker som används för datareduktion eller strukturdetektering. Dessa två metoder används på en enda uppsättning variabler när forskaren är intresserad av upptäcka vilka variabler i uppsättningen som bildar sammanhängande delmängder som är relativt oberoende av en annan. Variabler som är korrelerade med varandra men som i stort sett är oberoende av andra uppsättningar av variabler kombineras till faktorer. Dessa faktorer låter dig kondensera antalet variabler i din analys genom att kombinera flera variabler till en faktor.

De specifika målen för PCA eller FA är att sammanfatta mönster av korrelationer bland observerade variabler, för att reducera ett stort antal observerade variabler till ett mindre antal faktorer, för att tillhandahålla en regressions ekvation för en underliggande process genom att använda observerade variabler, eller för att testa en teori om arten av underliggande processer.

Exempel

Säg till exempel att en forskare är intresserad av att studera egenskaperna hos doktorander. Forskaren undersöker ett stort urval av doktorander på personlighetskarakteristika som motivation, intellektuell förmåga, skolastisk historia, familjehistoria, hälsa, fysiska egenskaper, etc. Var och en av dessa områden mäts med flera variabler. Variablerna införs sedan individuellt i analysen och korrelationer bland dem studeras. Analysen avslöjar korrelationsmönster mellan variablerna som tros reflektera de underliggande processerna som påverkar de studerandes beteenden. Till exempel kombinerar flera variabler från måtten för intellektuell förmåga med vissa variabler från de skolastiska mätningarna för att bilda en faktor som mäter intelligens. På samma sätt kan variabler från personlighetsmåtten kombineras med vissa variabler från motivation och skolastik historien mäter en faktor som mäter i vilken grad en student föredrar att arbeta självständigt - en självständighet faktor.

instagram viewer

Steg för huvudkomponentanalys och faktoranalys

Steg i huvudkomponentanalys och faktoranalys inkluderar:

  • Välj och mät en uppsättning variabler.
  • Förbered korrelationsmatrisen för att utföra antingen PCA eller FA.
  • Extrahera en uppsättning faktorer från korrelationsmatrisen.
  • Bestäm antalet faktorer.
  • Rotera om nödvändigt faktorerna för att öka tolkbarheten.
  • Tolk resultaten.
  • Verifiera faktorstrukturen genom att fastställa faktorns konstruktionsgiltighet.

Skillnad mellan analys av huvudkomponenter och faktoranalys

Analys av huvudkomponenter och faktoranalys liknar eftersom båda procedurerna används för att förenkla strukturen för en uppsättning variabler. Analyserna skiljer sig dock på flera viktiga sätt:

  • I PCA beräknas komponenterna som linjära kombinationer av de ursprungliga variablerna. I FA definieras de ursprungliga variablerna som linjära kombinationer av faktorerna.
  • I PCA är målet att redovisa så mycket av det totala variation i variablerna som möjligt. Målet i FA är att förklara samvarier eller korrelationer mellan variablerna.
  • PCA används för att minska uppgifterna till ett mindre antal komponenter. FA används för att förstå vilka konstruktioner som ligger till grund för uppgifterna.

Problem med huvudkomponentanalys och faktoranalys

Ett problem med PCA och FA är att det inte finns någon kriterievariabel att testa lösningen mot. I andra statistiska tekniker såsom diskriminerande funktionsanalys, logistisk regression, profilanalys och multivariat variansanalys, bedöms lösningen utifrån hur väl den förutspår gruppmedlemskap. I PCA och FA finns det inget externt kriterium som gruppmedlemskap att testa lösningen mot.

Det andra problemet med PCA och FA är att efter extraktion finns det ett oändligt antal rotationer tillgängliga, alla står för samma mängd avvikelse i de ursprungliga uppgifterna, men med faktorn definierad något annorlunda. Det slutliga valet lämnas till forskaren utifrån deras bedömning av dess tolkbarhet och vetenskapliga användbarhet. Forskare skiljer sig ofta i vilket val som är bäst.

Ett tredje problem är att FA ofta används för att ”rädda” forskning som är dåligt tänkt. Om inget annat statistiskt förfarande är lämpligt eller tillämpligt kan uppgifterna åtminstone faktoranalyseras. Detta får många att tro att de olika formerna av FA är förknippade med slarvig forskning.

instagram story viewer