Régression

Analyse de régression en R et Python.

La régression est une méthode d'étude de la dépendance d'une variable y par rapport à une autre variable x. La méthode d'analyse repose sur le fait que la variable étudiée peut être décrite à l'aide d'une fonction qui dépend des valeurs d'une autre variable contrôlée. En d’autres termes, connaissant les valeurs de X, vous pouvez prédire avec assez de précision la valeur correspondante de y. Il existe deux méthodes d'analyse de régression : la régression linéaire par paires et la corrélation multiple.

Dans cet article, nous expliquerons comment effectuer une régression dans les langages de programmation populaires « R » et « Python ». Aussi



Les tests de régression sont le processus de recherche d'erreurs (bugs) à l'intérieur d'une fonction à l'aide d'un modèle mathématique qui prédira le fonctionnement du programme quels que soient les paramètres d'entrée sélectionnés. Ce type de test est très précis. La théorie de la prédiction mathématique est utilisée pour trouver des failles dans le code.

L'analyse de régression est une branche des mathématiques. Il est basé sur l'étude des dépendances linéaires entre variables - un changement dans l'une affecte l'autre. La dépendance linéaire est exprimée par une équation de la forme y = ax + b. Les coefficients a et b sont déterminés par la méthode des moindres carrés et expriment les performances d'erreur du modèle testé. L'utilisation de la méthode des moindres carrés permet de trouver non seulement la droite de régression elle-même, mais également tous les points « sujets aux déviations » situés en dessous de celle-ci. Cela vous permet de créer une liste de points de données dangereux pour lesquels de nouveaux tests doivent être implémentés en premier.

L'essence de l'algorithme de régression est d'augmenter continuellement le nombre de tests reproductibles à l'aide de techniques d'optimisation et de paramètres de test. Le but de l'algorithme est d'évaluer en permanence le nombre d'échantillons produits par rapport au plan de test généré. Tout cela peut être exprimé par la formule :

n(i+1) = n(i) + ln(Erreur/n)/db(l)

La fonction J décrit le nombre