Regressionsanalyse i R og Python.
Regression er en metode til at studere afhængigheden af en variabel y af en anden variabel x. Analysemetoden er baseret på, at den undersøgte variabel kan beskrives ved hjælp af en funktion, der afhænger af værdierne af en anden kontrolleret variabel. Med andre ord, ved at kende værdierne af X, kan du ret præcist forudsige den tilsvarende værdi af y. Der er to metoder til regressionsanalyse: parvis lineær regression og multipel korrelation.
I denne artikel vil vi tale om, hvordan man udfører regression i de populære programmeringssprog "R" og "Python". Også
Regressionstest er processen med at søge efter fejl (bugs) inde i en funktion ved hjælp af en matematisk model, der vil forudsige programmets funktion uanset de valgte inputparametre. Denne type test er meget nøjagtig. Matematisk forudsigelsesteori bruges til at finde fejl i koden.
Regressionsanalyse er en gren af matematikken. Den er baseret på studiet af lineære afhængigheder mellem variabler – en ændring i den ene påvirker den anden. Lineær afhængighed udtrykkes ved en ligning på formen y = ax + b. Koefficienterne a og b bestemmes ved mindste kvadraters metode og udtrykker fejlydelsen af den testede model. Ved at bruge metoden med mindste kvadrater kan du ikke kun finde selve regressionslinjen, men også alle de "afvigelsesudsatte" punkter, der er placeret under den. Dette giver dig mulighed for at oprette en liste over farlige datapunkter, hvor nye test skal implementeres først.
Essensen af regressionsalgoritmen er løbende at øge antallet af reproducerbare test ved hjælp af optimeringsteknikker og testparametre. Formålet med algoritmen er løbende at evaluere antallet af producerede prøver i forhold til den genererede testplan. Alt dette kan udtrykkes med formlen:
n(i+1) = n(i) + ln(fejl/n)/db(l)
J-funktionen beskriver tallet