Ismerje meg, mi az egyszerű lineáris regresszió és hogyan működik

A kvantitatív adatok elemzésével kapcsolatos alapvető statisztikák

Courtesy Colin Broug, fotós. © 2010. június 10. Stock.xchng

A lineáris regressziós modelleket két változó vagy tényező kapcsolatának megmutatására vagy megjósolására használjuk. Az előrejelzett tényező (az a tényező, amelyre az egyenlet megoldódik ) nevezzük függő változó. A függő változó értékének megjósolásához használt tényezőket független változóknak nevezik.

A jó adatok nem mindig mondják el a teljes történetet. A regressziós analízist gyakran használják a kutatásban, mivel megállapítja, hogy a változók között korreláció van.

De a korreláció nem ugyanaz, mint az okozati összefüggés . Még egy lineáris lineáris regresszió, amely jól illeszkedik az adatpontokhoz, nem mondhat valami véglegeset egy ok-okozati kapcsolatról.

Egyszerű lineáris regresszióban minden megfigyelés két értékből áll. Az egyik érték a függő változó, és egy érték a független változó.

Egyszerű lineáris regressziós modell

Az egyszerű lineáris regressziós modell az alábbiak szerint jelenik meg: y = ( β 0 + β 1 + Ε

Matematikai konvenció szerint az egyszerű lineáris regressziós analízisbe bevont két tényezőt x és y jelölik.

Az egyenlet, amely leírja, hogy y összefüggésben van x-vel , regressziós modellként ismert. A lineáris regressziós modell tartalmaz egy hiba kifejezést, amelyet Ε , vagy a görög epsilon betű jelez. A hiba kifejezést használjuk az y változékonyságának figyelembe vételére, amely nem magyarázható az x és y lineáris kapcsolatával .

Vannak olyan paraméterek is, amelyek a vizsgált populációt képviselik. A modell paraméterei, amelyeket ( β 0+ β 1 x ) képviselnek.

Egyszerű lineáris regressziós modell

Az egyszerű lineáris regressziós egyenlet a következőképpen ábrázolódik: Ε ( y ) = ( β 0 + β 1 x ).

Az egyszerű lineáris regressziós egyenletet egyenes vonalként ábrázoljuk.

( β 0 az y intercept a regressziós vonalból.

β 1 a lejtés.

Ε ( y ) az y átlagos vagy várt értéke egy adott x értéknél.

A regressziós vonal pozitív lineáris kapcsolatot, negatív lineáris kapcsolatot vagy nem kapcsolatot mutathat. Ha a grafikus vonal egy egyszerű lineáris regresszióban lapos (nem lejtős), akkor nincs kapcsolat a két változó között. Ha a regressziós vonal a vonal alsó végéhez képest felfelé hajlik, a grafikon y tengelyének (tengelye) és a vonal felső vonala felé haladva, a x mezőbe (tengely) távolodva pozitív lineáris kapcsolat van . Ha a regressziós vonal lefelé lefelé a vonal felső vonalánál a gráf y interceptjén (tengelyen), és a vonal alsó vége lefelé a gráfmezőbe, az x intercept (tengely) felé negatív lineáris kapcsolat áll fenn.

Becsült lineáris regressziós egyenlet

Ha a populáció paraméterei ismertek voltak, az egyszerű lineáris regressziós egyenlet (az alábbiakban látható) használható az y átlagértékének kiszámításához x ismert értékhez.

Ε ( y ) = ( β 0 + β 1 x ).

A gyakorlatban azonban a paraméterértékek nem ismertek, ezért azokat a populáció mintájából származó adatok felhasználásával kell becsülni. A populáció paramétereit mintavételi statisztikák segítségével becsüljük meg . A mintavételi statisztikákat b 0 + b 1 jelöli. Amikor a minta statisztikája helyettesítjük a populációs paramétereket, a becsült regressziós egyenlet alakul ki.

A becsült regressziós egyenlet az alábbiakban látható.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) kiejtik.

A becsült egyszerű regressziós egyenlet grafikonját a becsült regressziós vonalnak nevezzük.

A b 0 az y intercept.

Az b 1 a lejtés.

A ŷ ) egy y érték becsült értéke egy adott x értékhez.

Fontos megjegyzés: A regresszióanalízist nem használjuk a változók közötti ok-okozati összefüggések értelmezésére. A regresszióanalízis azonban azt jelezheti, hogy a változók összefüggnek egymással, illetve milyen mértékben kapcsolódnak egymáshoz a változók .

Ily módon a regressziós elemzés hajlamos kiemelkedő kapcsolatokat kialakítani, amelyek indokolttá teszik egy jól megismert kutatót, hogy közelebbről megvizsgálja .

Szintén ismert: kétváltozós regresszió, regressziós analízis

Példák: A legkisebb négyzetek módszer statisztikai eljárás mintaadatok felhasználására a becsült regressziós egyenlet értékének megállapításához. A legkisebb négyzetek módszert Carl Friedrich Gauss javasolta, aki 1777-ben született és 1855-ben meghalt. A legkisebb négyzetek módszerét még mindig széles körben használják.

Forrás:

Anderson, DR, Sweeney, DJ és Williams, TA (2003). Az üzleti és közgazdasági statisztikák alapjai (3. kiadás) Mason, Ohio: Southwestern, Thompson Learning.

______. (2010). Magyarázta: Regresszióelemzés. MIT News.

McIntyre, L. (1994). Cigarettaadatok használata a többszörös regresszióhoz. Journal of Statistics Education, 2 (1).

Mendenhall, W. és Sincich, T. (1992). Statisztika: Engineering and the Sciences (3. kiadás), New York, NY: Dellen Publishing Co.

Panchenko, D. 18.443 Alkalmazási statisztikák, 2006. ősze, 14. szakasz, Egyszerű lineáris regresszió. (Massachusetts Institute of Technology: MIT OpenCourseWare)