Good Survey Research Design försöker minska provtagningsfelet
Vad är ett förtroendeintervall?
Ett konfidensintervall är den felmarginal som en forskare skulle uppleva om han eller hon kunde fråga en viss forskningsfråga , säg av varje medlem av målpopulationen och få samma svar tillbaka som provtagarna gav i undersökningen.
Till exempel, om forskaren använde ett konfidensintervall på 4 och 60% av deltagarna i undersökningsexemplet svarade "Skulle rekommendera till vänner", kunde han vara säker på att mellan 54% och 64% av medlemmarna av hela målpopulationen skulle säg också "skulle rekommendera till vänner" när du ställde samma fråga. Förtroendeintervallet är i detta fall +/- 4.
Vad är en konfidensnivå?
En konfidensnivå är ett uttryck för hur säker en forskare kan vara av data som erhållits ur ett prov. Förtroendenivåer uttrycks i procent och anger hur ofta den procentandelen av målpopulationen skulle ge ett svar som ligger inom konfidensintervallet. Den mest använda konfidensenivån är 95%. Ett relaterat koncept kallas statistisk signifikans.
En forskares förtroende för sannolikheten för att hans prov är verkligt representativt för målpopulationen påverkas av ett antal faktorer.
En forskares förtroende för sin studiedesign och implementering - och en medvetenhet om dess begränsningar - bygger i stor utsträckning på tre viktiga variabler: Provstorlek, frekvens av respons och befolkningsstorlek. Forskare har länge kommit överens om att dessa variabler måste övervägas noggrant under forskningsplaneringsfasen.
- Provstorlek Generellt sett levererar större prover data som verkligen återspeglar målpopulationen. Ett brett konfidensintervall är en indikation på mindre förtroende för data eftersom det finns en större felmarginal . Ett brett konfidensintervall är som att säkra dina spel. Även om det finns en relation mellan konfidensintervall och provstorlek, men det är inte ett linjärt förhållande . En forskare kan inte minska konfidensnivån i hälften genom att dubblera provstorleken.
- Svarfrekvens Noggrannheten med vilka provdata återspeglar målpopulationen beror också på andelen svarande som svarade specifikt eller svarade på ett visst sätt . Ju större antal svarande som gav ett speciellt svar, säger "Mycket glad", den surare forskaren kan vara av det svaret. Det kommer att finnas en viss variabilitet i procenten i mitten av den normala kurvan. Det vill säga om en forskare är 50% säker på att medlemmar av målpopulationerna kommer att svara (inom ett konfidensintervall) som medlemmar i provpopulationen, är det sannolikt att det kommer att vara någon variation från den 50% -nivån.
Det är bra att komma ihåg att outliers (data som ligger längst ner eller svansar av den normala kurvan) är mer benägna att inträffa i ungefär samma takt i befolkningen som de gör i ett prov - det är mindre variation här , eftersom det finns lägre frekvens . (Tänk på hur kulorna i en Galton-box tenderar att stapla upp i mitten vid Stilla Vetenskapscentrumets utställning? Bara några bollar studsar in i svansarna.) Av den anledningen är det lättare att vara övertygad om frekvensen av extrema svar .
- Befolkningsstorlek är inte en viktig faktor i provstorlek såvida inte en forskare arbetar med en befolkning som är mycket liten och känd för honom eller henne (t ex tillräckligt liten för att alla befolkningsgrupper kan identifieras av forskaren).
Creative Research Systems påpekar att:
Matematiken av sannolikhet visar att befolkningens storlek är irrelevant om inte provets storlek överstiger några procent av den totala befolkningen du undersöker. Det betyder att ett urval av 500 personer är lika användbart för att undersöka åsikterna i en stat på 15.000.000, eftersom det skulle vara en stad på 100.000.
Att generera ett representativt prov kan vara en dyr och tidskrävande process. Forskare står alltid inför en avvägning mellan den konfidensnivå de vill ha - eller graden av noggrannhet som de behöver uppnå - och det konfidensnivå de har råd med.
Provstorlek i kvalitativ undersökning
Kvalitativ forskning är utforskande eller beskrivande i naturen och fokuserar inte på siffror eller mätningar. Men oro för provtagningsfel i kvalitativa undersökningar är fortfarande gällande. Som en allmän regel, om ett prov är representativt för måluniverset, kommer de teman eller mönster som kommer fram från forskningen att återspegla den större befolkningen som är av intresse för forskaren. Om provet är både representativt och består av en stor andel av målpopulationen, tenderar förtroendet för noggrannheten av data som härrör från detta prov att vara hög.
Bestämning av provstorlek i undersökningar
Olika regler gäller kvantitativ forskning och kvalitativ forskning när det gäller att bestämma provstorlek. Generellt sett måste en forskare ha en klar uppfattning om hur data ska användas för att vara säker på data som genereras av kvalitativ undersökning. Uppgifterna kan ligga till grund för en beskrivande berättelse (som i en fallstudie eller någon etnografisk forskning) eller det kan på ett exploratory sätt fungera för att identifiera relevanta variabler som senare kan testas för korrelationer i en kvantitativ studie.
Provstorlek i kvantitativ undersökning
Kvantitativ forskning innebär ofta jämförelser mellan marknadssegment eller undergrupper på en målmarknad. Eftersom kvantitativ forskning är numrerad, kan det vara ganska enkelt att bestämma en bekväm provstorlek. För varje viktig grupp eller segment i en studie hoppas en forskare kunna undersöka 100 deltagare. Detta nummer är en rekommendation och inte absolut. En marknadsundersökare kommer att överväga ett antal relevanta variabler för att bestämma storleken på ett prov i undersökningsforskning.
När man bedriver marknadsundersökningar är målet att utgå från urvalet som sannolikt kommer att vara sant för måluniverset. Ett urval ger data som kan observeras eller kännas. Från denna observerade eller kända data kan en forskare uppskatta graden till vilken ett okänt värde eller en parameter kan hittas i en målpopulation.
Kvantitativ undersökningsforskning bygger på begreppet normal symmetrisk kurva som i forskarens sinne representerar måluniverset - den befolkning som forskaren måste uppskatta i stället för att faktiskt känna till parametrar. Ett representativt prov gör att en forskare kan beräkna - från provdata - ett uppskattat antal värden som sannolikt kommer att inkludera det okända värdet eller parametern som är av intresse. Detta uppskattade värdeområde representerar ett område på normal kurva och uttrycks generellt som ett decimaltal eller en procentandel.
Den normala kurvan och sannolikheten
En normal symmetrisk kurva är ett visuellt uttryck för sannolikheten. Låt oss titta på en enkel heuristisk: En aktivitet på ett science center gör att ett stort antal bollar faller mellan två akrylplattor, en i taget. Varje boll faller genom samma öppning längst upp på skärmen och faller sedan mellan någon av de vertikala, parallella delarna som skiljer bunkarna när de kommer att vila. Efter flera timmar har bollarna formen av en normal kurva. Kurvan förändras lite eftersom varje nyintroducerad boll träffar massan av bollar som kom först. Men övergripande är den symmetriska kurvan uppenbar och det uppstod naturligt oberoende av någon åtgärd av observatörer eller personal från Science Center. Den böjda formen som bollarna bildar återspeglar sannolikheten att de flesta bollarna kommer att falla in i mitten och stanna där. Färre bollar kommer att göra det i kurvornas yttersta ändar - det kommer oundvikligen att bli, men de är få i antal.
Denna normala kurva liknar konceptet för ett prov. Varje gång displayen töms ut och bollarna återigen får falla in i Galton-rutan blir konfigurationen av bollarna av bollar bara lite annorlunda. Men över tiden kommer kurvens form inte att förändras mycket och mönstret kommer att vara sant.