Preberite, kakšna je preprosta linearna regresija in kako deluje

Osnovni pristop k analizi kvantitativnih podatkov

Vljudnost Colin Broug, fotograf. © 10. junija 2010 Stock.xchng

Modeli linearne regresije se uporabljajo za prikaz ali napovedovanje razmerja med dvema spremenljivkama ali dejavniki . Faktor, ki se napoveduje (faktor, za katerega velja enačba), se imenuje odvisna spremenljivka. Dejavniki, ki se uporabljajo za napovedovanje vrednosti odvisne spremenljivke, imenujemo neodvisne spremenljivke.

Dobri podatki ne kažejo vedno popolne zgodbe. Regresijska analiza se pogosto uporablja pri raziskavah, saj ugotovi, da obstaja korelacija med spremenljivkami.

Toda korelacija ni enaka vzročni zvezi . Tudi linija v preprosti linearni regresiji, ki dobro ustreza podatkovnim točkam, ne more reči nič definitivnega glede vzročno-posledičnega razmerja.

Pri preprosti linearni regresiji vsaka opazovanja sestavljata dve vrednosti. Ena vrednost je za odvisno spremenljivko in ena vrednost je za neodvisno spremenljivko.

Model enostavne linearne regresije

Preprost linearni regresijski model je predstavljen takole: y = ( β 0 + β 1 + Ε

Z matematično konvencijo sta dva dejavnika, vključena v preprosto linearno regresijsko analizo, označena kot x in y .

Enačba, ki opisuje, kako je y povezana z x, je znana kot regresijski model . Model linearne regresije vsebuje tudi izraz napake, ki ga predstavlja E ali grška črka epsilon. Izraz napake se uporablja za upoštevanje variabilnosti v y, ki je ni mogoče razložiti z linearnim razmerjem med x in y .

Obstajajo tudi parametri, ki predstavljajo populacijo, ki se preučuje. Ti parametri modela, ki jih predstavlja ( β 0 + β 1 x ).

Model enostavne linearne regresije

Enostavna enačba linearne regresije je predstavljena tako: E ( y ) = ( β 0 + β 1 x ).

Preprosta linearna regresijska enačba je grapirana kot ravna črta.

( β 0 je y presek regresijske črte.

β 1 je naklon.

Ε ( y ) je srednja ali pričakovana vrednost y za dano vrednost x .

Regresijska linija lahko kaže pozitivno linearno razmerje, negativno linearno razmerje ali pa nobeno razmerje. Če je obrobljena črta v preprosti linearni regresiji ravna (ne nagnjena), ni nobene povezave med obema spremenljivkama. Če se regresijska linija nagne navzgor z spodnjim koncem črte na preseku y y (osi) grafa in zgornji konec črte, ki se razteza navzgor v polje grafa, odmaknjena od x prestrezanja (os), obstaja pozitivna linearna zveza . Če regresijska črta nagne navzdol z zgornjim koncem črte na prestrezanju y (osi) grafa in spodnji konec črta, ki se razteza navzdol v polje grafa, proti x prestrezanju (osi) obstaja negativna linearna zveza.

Ocenjena linearna regresijska enačba

Če so bili znani parametri prebivalstva , bi se lahko uporabila preprosta linearna regresijska enačba (prikazana spodaj) za izračun povprečne vrednosti y za znano vrednost x .

E ( y ) = ( β 0 + β 1 x ).

Vendar v praksi vrednosti parametrov niso znane, zato jih je treba oceniti z uporabo podatkov iz vzorca prebivalstva. Parametri populacije so ocenjeni z uporabo statističnih podatkov o vzorcih . Statistični podatki o vzorcih so predstavljeni z b 0 + b 1. Ko se vzorčne statistike nadomestijo s populacijskimi parametri, se oblikuje ocenjena regresijska enačba.

Ocenjena regresijska enačba je prikazana spodaj.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) je izgovorjen y hat .

Graf ocenjene preproste regresijske enačbe imenujemo ocenjena regresijska črta.

B 0 je presledek y.

B 1 je naklon.

Ŷ ) je ocenjena vrednost y za dano vrednost x .

Pomembno opozorilo: Regresijska analiza se ne uporablja za razlago vzročno-posledičnih razmerij med spremenljivkami. Regresijska analiza pa lahko navede, kako so spremenljivke povezane ali v kolikšni meri so spremenljivke povezane med seboj.

Pri tem regresijska analiza kaže, da so pomembni odnosi, ki upravičeno zahtevajo pozornejši raziskovalec .

Znana tudi kot bivariatna regresija, regresijska analiza

Primeri: Metoda najmanjših kvadratov je statistični postopek za uporabo vzorčnih podatkov, da bi našli vrednost ocenjene regresijske enačbe. Metoda najmanjših kvadratov je predlagal Carl Friedrich Gauss, ki se je rodil leta 1777 in je umrl leta 1855. Metoda najmanjših kvadratov se še vedno pogosto uporablja.

Viri:

Anderson, DR, Sweeney, DJ in Williams, TA (2003). Osnovni podatki za podjetja in ekonomijo (3. izd.) Mason, Ohio: Southwestern, Thompson Learning.

______. (2010). Pojasnjeno: Regresijska analiza. MIT News.

McIntyre, L. (1994). Uporaba cigaretnih podatkov za uvod v več regresij. Journal of Education Education, 2 (1).

Mendenhall, W., in Sincich, T. (1992). Statistika za inženiring in znanosti (3. izd.), New York, NY: Dellen Publishing Co.

Panchenko, D. 18.443 Statistika za aplikacije, jesen 2006, poglavje 14, enostavna linearna regresija. (Massachusetts Institute of Technology: MIT OpenCourseWare)