Jaki jest prosty model regresji liniowej i jak to działa

Jaki jest prosty model regresji liniowej i jak to działa

Modele regresji liniowej są używane do pokazania lub przewidywania związku między dwiema zmiennymi lub czynnikami. Prognozowany czynnik (czynnik, że równanie rozwiązuje) nazywa sięzmienna zależna. Czynniki używane do przewidywania wartości zmiennej zależnej są nazywane zmiennymi niezależnymi.

W regresji liniowej każda obserwacja składa się z dwóch wartości. Jedna wartość dotyczy zmiennej zależnej, a jedna wartość dotyczy zmiennej niezależnej. W tym prostym modelu linia prosta przybliża związek między zmienną zależną a zmienną niezależną.

Gdy w analizie regresji stosuje się dwie lub więcej niezależnych zmiennych, model nie jest już prostym liniowym. Jest to znane jako regresja wielokrotna.

Wzór dla prostego modelu regresji liniowej

Dwa czynniki zaangażowane w prostą analizę regresji liniowej są oznaczone X I y. Równanie, które opisuje, jak y odnosi się do X jest znany jako Model regresji.

Prosty model regresji liniowej jest reprezentowany przez:

y = β0 +β1X

Model regresji liniowej zawiera termin błędu reprezentowany przez ε. Termin błędu służy do uwzględnienia zmienności w y Nie można tego wytłumaczyć liniową relacją między X I y. Gdyby ε nie był obecny, oznaczałoby to, że wiedza X dostarczyłby wystarczającą ilość informacji, aby określić wartość y.

Istnieją również parametry reprezentujące badaną populację. Te parametry modelu są reprezentowane przez β0 I β1.

Proste równanie regresji liniowej jest wykresywane jako linia prosta, gdzie:

  1. β0 jest przecięciem y linii regresji.
  2. β1 jest nachyleniem.
  3. Ε(y) to średnia lub oczekiwana wartość y dla danej wartości X.

Linia regresji może wykazywać pozytywną relację liniową, negatywną relację liniową lub brak związku.

  1. Brak relacji: Linia wykresu w prostej regresji liniowej jest płaska (nie nachylona). Nie ma związku między dwiema zmiennymi.
  2. Pozytywna relacja: Linia regresji nachyla się w górę z dolnym końcem linii na przecięciu Y (osi) wykresu i górnego końca linii rozciągającej się w górę do pola wykresu, z dala od przecięcia X (oś). Istnieje dodatnia liniowa zależność między dwiema zmiennymi: wraz ze wzrostem wartości jednego, wartość drugiego również wzrasta.
  3. Relacja negatywna: Linia regresji pochyla się w dół z górnym końcem linii na przecięciu y (osi) wykresu i dolnej części linii rozciągającej się w dół do pola wykresu, w kierunku przecięcia x (oś). Istnieje ujemna liniowa zależność między dwiema zmiennymi: wraz ze wzrostem wartości jednego, wartość drugiego zmniejsza się.

Szacowane równanie regresji liniowej

Jeśli znane były parametry populacji, proste równanie regresji liniowej (pokazane poniżej) można zastosować do obliczenia średniej wartości y dla znanej wartości X.

Ε(y) = β0 +β1X

W praktyce jednak wartości parametrów na ogół nie są znane, więc należy je oszacować przy użyciu danych z próby populacji. Parametry populacji są szacowane przy użyciu statystyki próbki. Przykładowe statystyki są reprezentowane przez β0 I β1. Gdy statystyki próbki są zastąpione parametrami populacji, powstaje równanie regresji szacowanej.

Szacowane równanie regresji to:

(ŷ) = β0 +β1X

Notatka: (ŷ) jest wymawiane Y Hat.

Wykres szacowanego równania prostej regresji nazywa się szacowaną linią regresji.

  1. β0 jest przecięciem y linii regresji.
  2. β1 jest nachyleniem.
  3. (ŷ) jest szacunkową wartością y dla danej wartości X.

Granice prostej regresji liniowej

Nawet najlepsze dane nie opowiadają kompletnej historii. 

Analiza regresji jest powszechnie stosowana w badaniach w celu ustalenia, że ​​istnieje korelacja między zmiennymi. Ale korelacja nie jest taka sama co związek przyczynowy: związek między dwiema zmiennymi nie oznacza, że ​​jeden powoduje, że druga się wydarzy. Nawet linia w prostej regresji liniowej, która dobrze pasuje do punktów danych, może nie zagwarantować związku przyczynowo-skutkowego.

Korzystanie z modelu regresji liniowej pozwoli ci odkryć, czy w ogóle istnieje związek między zmiennymi. Aby dokładnie zrozumieć ten związek i czy jedna zmienna powoduje inną, będziesz potrzebować dodatkowych badań i analizy statystycznej.