Lär dig vilken enkel linjär regression är och hur det fungerar

En grundläggande statistikmetod för att analysera kvantitativa data

Courtesy Colin Broug, Fotograf. © 10 juni, 2010 Stock.xchng

Lineära regressionsmodeller används för att visa eller förutsäga förhållandet mellan två variabler eller faktorer . Den faktor som förutspås (den faktor som ekvationen löser för ) kallas beroende variabel. De faktorer som används för att förutse värdet av den beroende variabeln kallas de oberoende variablerna.

Bra data berättar inte alltid hela berättelsen. Regressionsanalys används ofta i forskning, eftersom det fastställs att det finns en korrelation mellan variablerna.

Men korrelationen är inte densamma som orsakssambandet . Även en rad i en enkel linjär regression som passar datapunkterna väl kanske inte säger något definitivt om ett orsakssamband.

I enkel linjär regression består varje observation av två värden. Ett värde är för den beroende variabeln och ett värde är för den oberoende variabeln.

Enkel linjär regressionsmodell

Den enkla linjära regressionsmodellen representeras så här: y = ( β 0 + β 1 + Ε

Med matematisk konvention betecknas de två faktorer som är inblandade i en enkel linjär regressionsanalys x och y .

Ekvationen som beskriver hur y är relaterad till x är känd som regressionsmodellen . Den linjära regressionsmodellen innehåller också ett felbegrepp som representeras av Ε eller den grekiska bokstaven epsilon. Felbegreppet används för att ta hänsyn till variabiliteten i y som inte kan förklaras av det linjära förhållandet mellan x och y .

Där finns också parametrar som representerar befolkningen som studeras. Dessa parametrar av modellen som representeras av ( P 0 + P 1 x ).

Enkel linjär regressionsmodell

Den enkla linjära regressionsekvationen representeras så här: Ε ( y ) = ( β 0 + β 1 x ).

Den enkla linjära regressionsekvationen är grafad som en rak linje.

( p 0 är y- avlyssningen av regressionslinjen.

p 1 är lutningen.

Ε ( y ) är medelvärdet eller förväntat värde av y för ett givet värde av x .

En regressionslinje kan visa ett positivt linjärt förhållande, ett negativt linjärt förhållande eller inget förhållande. Om den grafiska linjen i en enkel linjär regression är platt (ej snedställd), finns det inget samband mellan de två variablerna. Om regressionslinjen lutar uppåt med den nedre änden av linjen vid y- avsnitten (axeln) i grafen och den övre änden av linjen sträcker sig uppåt i graffältet, bort från x- avsnitten (axeln) finns ett positivt linjärt förhållande . Om regressionslinjen sluttar nedåt med linjens övre ände vid y- avsnitten (axeln) i grafen och den nedre änden av linjen sträcker sig nedåt i graffältet, mot x- avsnitten (axeln) existerar ett negativt linjärt förhållande.

Beräknad linjär regression ekvation

Om parametrarna för befolkningen var kända kan den enkla linjära regressionsekvationen (visad nedan) användas för att beräkna medelvärdet av y för ett känt värde av x .

Ε ( y ) = ( P 0 + P 1 x ).

I praktiken är parametervärdena emellertid inte kända, så de måste beräknas med hjälp av data från ett urval av befolkningen. Befolkningsparametrarna beräknas med hjälp av provstatistik . Provstatistiken representeras av b 0 + b 1. När provstatistiken ersätts för populationsparametrarna bildas den beräknade regressionsekvationen.

Den uppskattade regressionsekvationen visas nedan.

( y ) = ( P 0 + P 1 x

( y ) uttalas y hat .

Grafen för den beräknade enkla regressionsekvationen kallas den beräknade regressionslinjen.

B 0 är y-avlyssningen.

B 1 är lutningen.

Y ) är det uppskattade värdet på y för ett givet värde av x .

Viktig anmärkning: Regressionsanalys används inte för att tolka orsakssamband mellan variabler. Regressionsanalys kan emellertid ange hur variabler är relaterade eller i vilken utsträckning variabler är associerade med varandra.

På så vis tenderar regressionsanalysen att skapa framträdande relationer som motiverar en kunnig forskare att ta en närmare titt .

Känd som: bivariat regression, regressionsanalys

Exempel: Den minsta kvadratmetoden är en statistisk procedur för att använda provdata för att hitta värdet av den uppskattade regressionsekvationen. Den Minsta Kvadreringsmetoden föreslogs av Carl Friedrich Gauss, som föddes år 1777 och dog 1855. Minsta kvadratmetoden används fortfarande allmänt.

källor:

Anderson, DR, Sweeney, DJ och Williams, TA (2003). Viktiga ämnen i statistik för näringsliv och ekonomi (3: e upp.) Mason, Ohio: Southwestern, Thompson Learning.

______. (2010). Förklarade: Regressionsanalys. MIT News.

McIntyre, L. (1994). Använda cigarettdata för en introduktion till flera regressioner. Journal of Statistics Education, 2 (1).

Mendenhall, W. och Sincich, T. (1992). Statistik för teknik och vetenskap (3: e upplagan), New York, NY: Dellen Publishing Co.

Panchenko, D. 18.443 Statistik för ansökningar, Fall 2006, Avsnitt 14, Enkel linjär regression. (Massachusetts Institute of Technology: MIT OpenCourseWare)