Регресия

Регресионен анализ в R и Python.

Регресията е метод за изследване на зависимостта на променлива y от друга променлива x. Методът за анализ се основава на факта, че изследваната променлива може да бъде описана с помощта на функция, която зависи от стойностите на друга контролирана променлива. С други думи, знаейки стойностите на X, можете доста точно да предвидите съответната стойност на y. Има два метода за регресионен анализ: линейна регресия по двойки и множествена корелация.

В тази статия ще говорим за това как да извършите регресия в популярните езици за програмиране `R` и `Python`. Също



Регресионното тестване е процесът на търсене на грешки (бъгове) във функция с помощта на математически модел, който ще предскаже функционирането на програмата, независимо от избраните входни параметри. Този тип тестване е много точен. Теорията за математически прогнози се използва за намиране на недостатъци в кода.

Регресионният анализ е клон на математиката. Базира се на изследването на линейни зависимости между променливите – промяната в едната се отразява на другата. Линейната зависимост се изразява с уравнение от вида y = ax + b. Коефициентите a и b се определят по метода на най-малките квадрати и изразяват ефективността на грешката на тествания модел. Използването на метода на най-малките квадрати ви позволява да намерите не само самата линия на регресия, но и всички точки, които са склонни към отклонение, разположени под нея. Това ви позволява да създадете списък с опасни точки от данни, където първо трябва да се внедрят нови тестове.

Същността на регресионния алгоритъм е непрекъснато да увеличава броя на възпроизводимите тестове, използвайки техники за оптимизация и параметри на теста. Целта на алгоритъма е непрекъснато да оценява броя на произведените проби спрямо генерирания тестов план. Всичко това може да се изрази с формулата:

n(i+1) = n(i) + ln(Грешка/n)/db(l)

Функцията J описва числото