Definition och exempel på sekundär dataanalys

Sekundärdataanalys är analysen av data som samlades in av någon annan. Nedan granskar vi definitionen av sekundära data, hur de kan användas av forskare och fördelar och nackdelar med denna typ av forskning.

Key Takeaways: Sekundär dataanalys

Primärdata avser data som forskare har samlat in själva, medan sekundärdata avser data som samlades in av någon annan.
Sekundär data finns från olika källor, till exempel regeringar och forskningsinstitutioner.
Även om det kan vara mer ekonomiskt att använda sekundär data kan befintliga datamängder inte besvara alla forskares frågor.

Jämförelse av primär och sekundär data

I samhällsvetenskaplig forskning är termerna primärdata och sekundära data vanligt förekommande. Primärdata samlas in av en forskare eller forskargrupp för det specifika syftet eller analysen som beaktas. Här tänker och utvecklar ett forskarlag ett forskningsprojekt, beslutar om en provtagningsteknik, samlar in data utformade för att adressera specifika frågor och gör sina egna analyser av de data de samlade in. I det här fallet är de som är involverade i dataanalysen bekanta med forskningsdesignen och datainsamlingsprocessen.

instagram viewer

Sekundär dataanalyså andra sidan är användningen av data som samlades in av någon annan för något annat syfte. I det här fallet ställer forskaren frågor som behandlas genom analys av en datamängd som de inte var involverade i insamlingen. Uppgifterna samlades inte in för att besvara forskarens specifika forskningsfrågor utan samlades istället för ett annat syfte. Detta innebär att samma datauppsättning faktiskt kan vara en primär datauppsättning för en forskare och en sekundär datauppsättning till en annan.

Använda sekundära data

Det är några viktiga saker som måste göras innan sekundära data används i en analys. Eftersom forskaren inte samlade in uppgifterna är det viktigt för dem att bli bekanta med datauppsättningen: hur uppgifterna samlades in, vad svarskategorierna är för varje fråga, huruvida vikter behöver appliceras under analysen, huruvida kluster eller stratifiering behöver redovisas, vem studiens befolkning var och inte Mer.

En hel del sekundära datakällor och datauppsättningar är tillgängliga för sociologisk forskning, av vilka många är offentliga och lättillgängliga. De USA: s folkräkning, Allmän social undersökning, och den American Community Survey är några av de mest använda sekundära datauppsättningarna tillgängliga.

Fördelar med sekundär dataanalys

Den största fördelen med att använda sekundära data är att det kan vara mer ekonomiskt. Någon annan har redan samlat in uppgifterna, så forskaren behöver inte ägna pengar, tid, energi och resurser till denna forskningsfas. Ibland måste den sekundära datauppsättningen köpas, men kostnaden är nästan alltid lägre än kostnaden för att samla in en liknande datauppsättning från grunden, vilket vanligtvis innebär lön, resor och transport, kontorslokaler, utrustning och andra omkostnader kostar. Eftersom informationen redan samlas in och vanligtvis rengörs och lagras i elektroniskt format, kan forskaren spendera större delen av sin tid analysera uppgifterna istället för att göra data redo för analys.

En andra viktig fördel med att använda sekundär data är bredden av tillgängliga data. Den federala regeringen genomför många studier i stor, nationell skala som enskilda forskare skulle ha svårt att samla in. Många av dessa datamängder är också longitudinell, vilket betyder att samma data har samlats in från samma population under flera olika tidsperioder. Detta gör det möjligt för forskare att titta på trender och förändringar av fenomen över tid.

En tredje viktig fördel med att använda sekundär data är att datainsamlingsprocessen ofta upprätthåller en nivå av expertis och professionalism som kanske inte finns hos enskilda forskare eller små forskningsprojekt. Till exempel utförs datainsamling för många federala datamängder ofta av personal som specialiserar sig i vissa uppgifter och har många års erfarenhet inom det specifika området och med den specifika undersökningen. Många mindre forskningsprojekt har inte den kompetensen, eftersom mycket data samlas in av studenter som arbetar deltid.

Nackdelar med sekundär dataanalys

En stor nackdel med att använda sekundär data är att den kanske inte svarar på forskarens specifika forskningsfrågor eller innehåller specifik information som forskaren vill ha. Det kanske inte heller har samlats in i den geografiska regionen eller under de önskade åren eller med den specifika befolkning som forskaren är intresserad av att studera. Till exempel kan en forskare som är intresserad av att studera ungdomar upptäcka att den sekundära datauppsättningen endast inkluderar unga vuxna.

Eftersom forskaren inte samlade in uppgifterna har de dessutom ingen kontroll över vad som finns i datauppsättningen. Ofta kan detta begränsa analysen eller ändra de ursprungliga frågorna som forskaren ville svara på. Till exempel kan en forskare som studerar lycka och optimism upptäcka att en sekundär datamängd endast innehåller en av dessa variabler, men inte båda.

Ett relaterat problem är att variablerna kan ha varit definieras eller kategoriseras annorlunda än vad forskaren skulle ha valt. Till exempel kan ålder ha samlats i kategorier snarare än som en kontinuerlig variabel, eller ras kan definieras som "vit" och "annat" i stället för att innehålla kategorier för varje större lopp.

En annan betydande nackdel med att använda sekundär data är att forskaren inte vet exakt hur datainsamlingsprocessen gjordes eller hur väl den genomfördes. Forskaren är vanligtvis inte intresserad av information om hur allvarligt uppgifterna påverkas av problem såsom låg svarsfrekvens eller missuppfattning av specifika undersökningsfrågor. Ibland är denna information lätt tillgänglig, liksom i många federala datamängder. Många andra sekundära datamängder åtföljs emellertid inte av denna typ av information och analytikern måste lära sig att läsa mellan raderna för att avslöja eventuella begränsningar av data.