Анализ Данных > Регрессия > Линейная регрессия 

Линейная регрессия

Самый простой и наиболее часто используемый вид регрессии – линейная. Приближение данных (xi,yi) осуществляется линейной функцией y(x)=b+a×x. На координатной плоскости (x,y) линейная функция, как известно, представляется прямой линией (рис. справа). Еще линейную регрессию часто называют методом наименьших квадратов, поскольку коэффициенты a и b вычисляются из условия минимизации суммы квадратов ошибок |b+a×xi-yi|2

Для расчета линейной регрессии используются следующие формулы

 Замечание. Чаще всего, такое же условие, т.е. минимизация суммы квадратов ошибок в узлах |b+axi-yi|2, ставится и в других задачах регрессии, т. е. приближения массива данных (xi,yi)  другими зависимостями y(x). Однако, имеются и альтернативные алгоритмы, минимизирующие сумму абсолютных значений медиан ошибок в узлах (медиан-медианная регрессия).Различие результатов среднеквадратичной (сплошная линия) и медиан-медианной (пунктир) линейной регрессии иллюстрируется рис. снизу.