A kvantitatív adatok elemzésével kapcsolatos alapvető statisztikák
A lineáris regressziós modelleket két változó vagy tényező kapcsolatának megmutatására vagy megjósolására használjuk. Az előrejelzett tényező (az a tényező, amelyre az egyenlet megoldódik ) nevezzük függő változó. A függő változó értékének megjósolásához használt tényezőket független változóknak nevezik.
A jó adatok nem mindig mondják el a teljes történetet. A regressziós analízist gyakran használják a kutatásban, mivel megállapítja, hogy a változók között korreláció van.
De a korreláció nem ugyanaz, mint az okozati összefüggés . Még egy lineáris lineáris regresszió, amely jól illeszkedik az adatpontokhoz, nem mondhat valami véglegeset egy ok-okozati kapcsolatról.
Egyszerű lineáris regresszióban minden megfigyelés két értékből áll. Az egyik érték a függő változó, és egy érték a független változó.
- Egyszerű lineáris regresszióelemzés A regressziós analízis legegyszerűbb formája függő változó és egy független változó használatával. Ebben az egyszerű modellben egyenes vonal közelíti a függő változó és a független változó közötti kapcsolatot.
- Több regressziós elemzés Ha két vagy több független változót használ a regressziós analízis során, a modell már nem egyszerű lineáris.
Egyszerű lineáris regressziós modell
Az egyszerű lineáris regressziós modell az alábbiak szerint jelenik meg: y = ( β 0 + β 1 + Ε
Matematikai konvenció szerint az egyszerű lineáris regressziós analízisbe bevont két tényezőt x és y jelölik.
Az egyenlet, amely leírja, hogy y összefüggésben van x-vel , regressziós modellként ismert. A lineáris regressziós modell tartalmaz egy hiba kifejezést, amelyet Ε , vagy a görög epsilon betű jelez. A hiba kifejezést használjuk az y változékonyságának figyelembe vételére, amely nem magyarázható az x és y lineáris kapcsolatával .
Vannak olyan paraméterek is, amelyek a vizsgált populációt képviselik. A modell paraméterei, amelyeket ( β 0+ β 1 x ) képviselnek.
Egyszerű lineáris regressziós modell
Az egyszerű lineáris regressziós egyenlet a következőképpen ábrázolódik: Ε ( y ) = ( β 0 + β 1 x ).
Az egyszerű lineáris regressziós egyenletet egyenes vonalként ábrázoljuk.
( β 0 az y intercept a regressziós vonalból.
β 1 a lejtés.
Ε ( y ) az y átlagos vagy várt értéke egy adott x értéknél.
A regressziós vonal pozitív lineáris kapcsolatot, negatív lineáris kapcsolatot vagy nem kapcsolatot mutathat. Ha a grafikus vonal egy egyszerű lineáris regresszióban lapos (nem lejtős), akkor nincs kapcsolat a két változó között. Ha a regressziós vonal a vonal alsó végéhez képest felfelé hajlik, a grafikon y tengelyének (tengelye) és a vonal felső vonala felé haladva, a x mezőbe (tengely) távolodva pozitív lineáris kapcsolat van . Ha a regressziós vonal lefelé lefelé a vonal felső vonalánál a gráf y interceptjén (tengelyen), és a vonal alsó vége lefelé a gráfmezőbe, az x intercept (tengely) felé negatív lineáris kapcsolat áll fenn.
Becsült lineáris regressziós egyenlet
Ha a populáció paraméterei ismertek voltak, az egyszerű lineáris regressziós egyenlet (az alábbiakban látható) használható az y átlagértékének kiszámításához x ismert értékhez.
Ε ( y ) = ( β 0 + β 1 x ).
A gyakorlatban azonban a paraméterértékek nem ismertek, ezért azokat a populáció mintájából származó adatok felhasználásával kell becsülni. A populáció paramétereit mintavételi statisztikák segítségével becsüljük meg . A mintavételi statisztikákat b 0 + b 1 jelöli. Amikor a minta statisztikája helyettesítjük a populációs paramétereket, a becsült regressziós egyenlet alakul ki.
A becsült regressziós egyenlet az alábbiakban látható.
( ŷ ) = ( β 0 + β 1 x
( ŷ ) kiejtik.
A becsült egyszerű regressziós egyenlet grafikonját a becsült regressziós vonalnak nevezzük.
A b 0 az y intercept.
Az b 1 a lejtés.
A ŷ ) egy y érték becsült értéke egy adott x értékhez.
Fontos megjegyzés: A regresszióanalízist nem használjuk a változók közötti ok-okozati összefüggések értelmezésére. A regresszióanalízis azonban azt jelezheti, hogy a változók összefüggnek egymással, illetve milyen mértékben kapcsolódnak egymáshoz a változók .
Ily módon a regressziós elemzés hajlamos kiemelkedő kapcsolatokat kialakítani, amelyek indokolttá teszik egy jól megismert kutatót, hogy közelebbről megvizsgálja .
Szintén ismert: kétváltozós regresszió, regressziós analízis
Példák: A legkisebb négyzetek módszer statisztikai eljárás mintaadatok felhasználására a becsült regressziós egyenlet értékének megállapításához. A legkisebb négyzetek módszert Carl Friedrich Gauss javasolta, aki 1777-ben született és 1855-ben meghalt. A legkisebb négyzetek módszerét még mindig széles körben használják.
Forrás:
Anderson, DR, Sweeney, DJ és Williams, TA (2003). Az üzleti és közgazdasági statisztikák alapjai (3. kiadás) Mason, Ohio: Southwestern, Thompson Learning.
______. (2010). Magyarázta: Regresszióelemzés. MIT News.
McIntyre, L. (1994). Cigarettaadatok használata a többszörös regresszióhoz. Journal of Statistics Education, 2 (1).
Mendenhall, W. és Sincich, T. (1992). Statisztika: Engineering and the Sciences (3. kiadás), New York, NY: Dellen Publishing Co.
Panchenko, D. 18.443 Alkalmazási statisztikák, 2006. ősze, 14. szakasz, Egyszerű lineáris regresszió. (Massachusetts Institute of Technology: MIT OpenCourseWare)