La méthode des moindres carrés est utilisée pour la définition. Analyse de régression par paire linéaire

  • 30.09.2019

L’essence de la méthode des moindres carrés est à trouver les paramètres d'un modèle de tendance qui décrit le mieux la tendance d'évolution de tout phénomène aléatoire dans le temps ou dans l'espace (une tendance est une ligne qui caractérise la tendance de cette évolution). La tâche de la méthode des moindres carrés (LSM) se résume non seulement à trouver un modèle de tendance, mais aussi à trouver le modèle le meilleur ou optimal. Ce modèle sera optimal si la somme des écarts carrés entre les valeurs réelles observées et les valeurs de tendance calculées correspondantes est minime (la plus petite) :

où est l'écart carré entre la valeur réelle observée

et la valeur de tendance calculée correspondante,

La valeur réelle (observée) du phénomène étudié,

La valeur calculée du modèle de tendance,

Le nombre d'observations du phénomène étudié.

MNC est assez rarement utilisé seul. En règle générale, il n'est le plus souvent utilisé que comme technique technique nécessaire dans les études de corrélation. Il ne faut pas oublier que la base d'information de l'OLS ne peut être qu'une série statistique fiable et que le nombre d'observations ne doit pas être inférieur à 4, sinon les procédures de lissage de l'OLS risquent de perdre leur bon sens.

La boîte à outils MNC se résume aux procédures suivantes :

Première procédure. Il s'avère qu'il existe une quelconque tendance à modifier l'attribut résultant lorsque le facteur-argument sélectionné change, ou en d'autres termes, existe-t-il un lien entre « à " Et " X ».

Deuxième procédure. Il est déterminé quelle ligne (trajectoire) peut le mieux décrire ou caractériser cette tendance.

Troisième procédure.

Exemple. Disons que nous disposons d'informations sur le rendement moyen en tournesol de la ferme étudiée (tableau 9.1).

Tableau 9.1

Numéro d'observation

Productivité, c/ha

Étant donné que le niveau technologique de la production de tournesol dans notre pays est resté pratiquement inchangé au cours des 10 dernières années, cela signifie que, apparemment, les fluctuations du rendement au cours de la période analysée dépendaient dans une large mesure des fluctuations des conditions météorologiques et climatiques. Est-ce vraiment vrai ?

Première procédure OLS. L'hypothèse de l'existence d'une tendance à l'évolution du rendement du tournesol en fonction de l'évolution des conditions météorologiques et climatiques au cours des 10 années analysées est testée.

Dans cet exemple, pour " oui " il est conseillé de prendre le rendement du tournesol, et pour " X » – numéro de l'année observée dans la période analysée. Tester l'hypothèse de l'existence d'une relation entre " X " Et " oui "peut être réalisé de deux manières : manuellement et à l'aide de programmes informatiques. Bien entendu, avec la disponibilité de la technologie informatique, ce problème peut être résolu de lui-même. Mais afin de mieux comprendre les outils MNC, il convient de tester l’hypothèse de l’existence d’une relation entre « X " Et " oui » manuellement, quand seuls un stylo et une calculatrice ordinaire sont à portée de main. Dans de tels cas, l'hypothèse sur l'existence d'une tendance est mieux vérifiée visuellement par l'emplacement de l'image graphique de la série de dynamiques analysée - le champ de corrélation :

Le champ de corrélation dans notre exemple est situé autour d’une ligne augmentant lentement. Cela en soi indique l'existence d'une certaine tendance dans l'évolution des rendements du tournesol. Il est impossible de parler de la présence d'une quelconque tendance uniquement lorsque le champ de corrélation ressemble à un cercle, un cercle, un nuage strictement vertical ou strictement horizontal, ou est constitué de points dispersés de manière chaotique. Dans tous les autres cas, l’hypothèse de l’existence d’une relation entre « X " Et " oui ", et poursuivez vos recherches.

Deuxième procédure OLS. Il est déterminé quelle ligne (trajectoire) peut le mieux décrire ou caractériser la tendance des changements de rendement en tournesol au cours de la période analysée.

Si vous disposez d'une technologie informatique, la sélection de la tendance optimale se fait automatiquement. Dans le traitement « manuel », la sélection de la fonction optimale est généralement effectuée visuellement - par l'emplacement du champ de corrélation. Autrement dit, en fonction du type de graphique, l'équation de la droite qui correspond le mieux à la tendance empirique (la trajectoire réelle) est sélectionnée.

Comme on le sait, dans la nature, il existe une grande variété de dépendances fonctionnelles, il est donc extrêmement difficile d'en analyser visuellement même une petite partie. Heureusement, dans la pratique économique réelle, la plupart des relations peuvent être décrites avec assez de précision soit par une parabole, soit par une hyperbole, soit par une ligne droite. A cet égard, avec l'option « manuelle » de sélection de la meilleure fonction, vous pouvez vous limiter à ces trois modèles uniquement.

Hyperbole:

Parabole du deuxième ordre : :

Il est facile de voir que dans notre exemple, la tendance des changements de rendement du tournesol au cours des 10 années analysées est mieux caractérisée par une ligne droite, donc l'équation de régression sera l'équation d'une ligne droite.

Troisième procédure. Les paramètres de l'équation de régression caractérisant cette droite sont calculés, ou en d'autres termes, une formule analytique est déterminée qui décrit le meilleur modèle de tendance.

Trouver les valeurs des paramètres de l'équation de régression, dans notre cas les paramètres et , est au cœur de l'OLS. Ce processus revient à résoudre un système d’équations normales.

(9.2)

Ce système d'équations peut être résolu assez facilement par la méthode de Gauss. Rappelons qu'à la suite de la solution, dans notre exemple, les valeurs des paramètres et sont trouvées. Ainsi, l'équation de régression trouvée aura la forme suivante :

Approchons la fonction par un polynôme de degré 2. Pour ce faire, on calcule les coefficients du système d'équations normal :

, ,

Créons un système de moindres carrés normal, qui a la forme :

La solution au système est facile à trouver :, , .

Ainsi, on trouve un polynôme du 2ème degré : .

Informations théoriques

Retour à la page<Введение в вычислительную математику. Примеры>

Exemple 2. Trouver le degré optimal d'un polynôme.

Retour à la page<Введение в вычислительную математику. Примеры>

Exemple 3. Dérivation d'un système normal d'équations pour trouver les paramètres de la dépendance empirique.

Dérivons un système d'équations pour déterminer les coefficients et les fonctions , qui effectue l'approximation efficace d'une fonction donnée par points. Composons une fonction et notez la condition extrême nécessaire pour cela :

Le système normal prendra alors la forme :

Nous avons obtenu un système linéaire d'équations pour des paramètres inconnus et qui est facilement résolu.

Informations théoriques

Retour à la page<Введение в вычислительную математику. Примеры>

Exemple.

Données expérimentales sur les valeurs des variables X Et à sont données dans le tableau.

Grâce à leur alignement, la fonction est obtenue

En utilisant méthode des moindres carrés, approximons ces données par une dépendance linéaire y=hache+b(trouver les paramètres UN Et b). Découvrez laquelle des deux droites (au sens de la méthode des moindres carrés) aligne le mieux les données expérimentales. Faites un dessin.

L'essence de la méthode des moindres carrés (LSM).

La tâche consiste à trouver les coefficients de dépendance linéaire auxquels la fonction de deux variables UN Et bprend la plus petite valeur. C'est-à-dire étant donné UN Et b la somme des carrés des écarts des données expérimentales par rapport à la droite trouvée sera la plus petite. C’est tout l’intérêt de la méthode des moindres carrés.

Ainsi, résoudre l’exemple revient à trouver l’extremum d’une fonction de deux variables.

Dériver des formules pour trouver des coefficients.

Un système de deux équations à deux inconnues est compilé et résolu. Trouver les dérivées partielles d'une fonction par variables UN Et b, nous assimilons ces dérivées à zéro.

Nous résolvons le système d'équations résultant en utilisant n'importe quelle méthode (par exemple par méthode de substitution ou méthode de Cramer) et obtenez des formules pour trouver des coefficients en utilisant la méthode des moindres carrés (LSM).

Donné UN Et b fonction prend la plus petite valeur. La preuve de ce fait est donnée ci-dessous dans le texte en fin de page.

C'est toute la méthode des moindres carrés. Formule pour trouver le paramètre un contient les sommes , , et le paramètre n— quantité de données expérimentales. Nous recommandons de calculer séparément les valeurs de ces montants.

Coefficient b trouvé après calcul un.

Il est temps de se souvenir de l'exemple original.

Solution.

Dans notre exemple n=5. Nous remplissons le tableau pour faciliter le calcul des montants inclus dans les formules des coefficients requis.

Les valeurs de la quatrième ligne du tableau sont obtenues en multipliant les valeurs de la 2ème ligne par les valeurs de la 3ème ligne pour chaque nombre je.

Les valeurs de la cinquième ligne du tableau sont obtenues en mettant au carré les valeurs de la 2ème ligne pour chaque nombre je.

Les valeurs de la dernière colonne du tableau sont les sommes des valeurs des lignes.

On utilise les formules de la méthode des moindres carrés pour trouver les coefficients UN Et b. Nous y substituons les valeurs correspondantes de la dernière colonne du tableau :

Ainsi, y = 0,165x+2,184— la droite d'approximation souhaitée.

Reste à savoir laquelle des lignes y = 0,165x+2,184 ou se rapproche mieux des données originales, c'est-à-dire effectue une estimation en utilisant la méthode des moindres carrés.

Estimation des erreurs de la méthode des moindres carrés.

Pour ce faire, vous devez calculer la somme des écarts carrés des données originales par rapport à ces lignes Et , une valeur plus petite correspond à une droite qui se rapproche mieux des données originales au sens de la méthode des moindres carrés.

Depuis, puis directement y = 0,165x+2,184 se rapproche mieux des données originales.

Illustration graphique de la méthode des moindres carrés (LS).

Tout est clairement visible sur les graphiques. La ligne rouge est la ligne droite trouvée y = 0,165x+2,184, la ligne bleue est , les points roses sont les données originales.

Pourquoi est-ce nécessaire, pourquoi toutes ces approximations ?

Je l'utilise personnellement pour résoudre des problèmes de lissage de données, d'interpolation et d'extrapolation (dans l'exemple original, on pourrait leur demander de trouver la valeur d'une valeur observée). ouià x=3 ou lorsque x=6 en utilisant la méthode des moindres carrés). Mais nous en reparlerons plus tard dans une autre section du site.

Haut de page

Preuve.

Pour que lorsqu'on le trouve UN Et b fonction prend la plus petite valeur, il faut qu'à ce stade la matrice de la forme quadratique de la différentielle du second ordre pour la fonction était positif et définitif. Montrons-le.

La différentielle du second ordre a la forme :

C'est

Par conséquent, la matrice de forme quadratique a la forme

et les valeurs des éléments ne dépendent pas de UN Et b.

Montrons que la matrice est définie positive. Pour ce faire, les mineurs angulaires doivent être positifs.

Mineur angulaire du premier ordre . L'inégalité est stricte car les points ne coïncident pas. Dans ce qui suit, nous le laisserons entendre.

Mineur angulaire du deuxième ordre

Prouvons que par la méthode de l'induction mathématique.

Conclusion: valeurs trouvées UN Et b correspond à la plus petite valeur de la fonction , ce sont donc les paramètres requis pour la méthode des moindres carrés.

Pas le temps de comprendre ?
Commander une solution

Haut de page

Élaborer une prévision en utilisant la méthode des moindres carrés. Exemple de solution de problème

Extrapolation est une méthode de recherche scientifique basée sur la diffusion des tendances, des modèles et des liens passés et présents avec le développement futur de l'objet de prévision. Les méthodes d'extrapolation comprennent méthode de moyenne mobile, méthode de lissage exponentiel, méthode des moindres carrés.

Essence méthode des moindres carrés consiste à minimiser la somme des écarts carrés entre les valeurs observées et calculées. Les valeurs calculées sont trouvées à l'aide de l'équation sélectionnée - l'équation de régression. Plus la distance entre les valeurs réelles et celles calculées est petite, plus la prévision basée sur l'équation de régression est précise.

Une analyse théorique de l'essence du phénomène étudié, dont l'évolution se reflète par une série temporelle, sert de base au choix d'une courbe. Parfois, des considérations sur la nature de l'augmentation des niveaux de la série sont prises en compte. Ainsi, si la croissance de la production est attendue selon une progression arithmétique, alors le lissage est effectué en ligne droite. S'il s'avère que la croissance est en progression géométrique, alors le lissage doit être effectué à l'aide d'une fonction exponentielle.

Formule de travail pour la méthode des moindres carrés : Oui t+1 = a*X + b, où t + 1 – période de prévision ; Уt+1 – indicateur prédit ; a et b sont des coefficients ; X est un symbole du temps.

Le calcul des coefficients a et b s'effectue à l'aide des formules suivantes :

où, Uf – valeurs réelles de la série dynamique ; n – nombre de niveaux de séries chronologiques ;

Le lissage des séries temporelles par la méthode des moindres carrés permet de refléter le schéma d'évolution du phénomène étudié. Dans l'expression analytique d'une tendance, le temps est considéré comme une variable indépendante, et les niveaux des séries agissent en fonction de cette variable indépendante.

L'évolution d'un phénomène ne dépend pas du nombre d'années écoulées depuis le point de départ, mais de quels facteurs ont influencé son développement, dans quelle direction et avec quelle intensité. Il ressort de là que l’évolution d’un phénomène dans le temps est le résultat de l’action de ces facteurs.

Établir correctement le type de courbe, le type de dépendance analytique au temps est l'une des tâches les plus difficiles de l'analyse prédictive .

La sélection du type de fonction décrivant la tendance, dont les paramètres sont déterminés par la méthode des moindres carrés, s'effectue dans la plupart des cas de manière empirique, en construisant un certain nombre de fonctions et en les comparant entre elles en fonction de la valeur de la fonction. erreur quadratique moyenne, calculée par la formule :

où UV sont les valeurs réelles de la série dynamique ; Ur – valeurs calculées (lissées) de la série dynamique ; n – nombre de niveaux de séries chronologiques ; p – le nombre de paramètres définis dans les formules décrivant la tendance (tendance de développement).

Inconvénients de la méthode des moindres carrés :

  • lorsque l'on tente de décrire le phénomène économique étudié à l'aide d'une équation mathématique, la prévision sera exacte pendant une courte période et l'équation de régression devra être recalculée à mesure que de nouvelles informations seront disponibles ;
  • la complexité de la sélection d'une équation de régression pouvant être résolue à l'aide de programmes informatiques standard.

Un exemple d'utilisation de la méthode des moindres carrés pour élaborer une prévision

Tâche . Il existe des données caractérisant le taux de chômage dans la région, %

  • Construire une prévision du taux de chômage dans la région pour novembre, décembre, janvier en utilisant les méthodes suivantes : moyenne mobile, lissage exponentiel, moindres carrés.
  • Calculez les erreurs dans les prévisions résultantes en utilisant chaque méthode.
  • Comparez les résultats et tirez des conclusions.

Solution des moindres carrés

Pour résoudre cela, nous établirons un tableau dans lequel nous effectuerons les calculs nécessaires :

ε = 28,63/10 = 2,86% précision de la prévision haut.

Conclusion : Comparaison des résultats obtenus à partir des calculs méthode de moyenne mobile , méthode de lissage exponentiel et la méthode des moindres carrés, nous pouvons dire que l'erreur relative moyenne lors du calcul à l'aide de la méthode de lissage exponentiel se situe dans la plage de 20 à 50 %. Cela signifie que l'exactitude des prévisions dans ce cas n'est que satisfaisante.

Dans les premier et troisième cas, la précision des prévisions est élevée, puisque l'erreur relative moyenne est inférieure à 10 %. Mais la méthode de la moyenne mobile a permis d'obtenir des résultats plus fiables (prévision pour novembre - 1,52%, prévision pour décembre - 1,53%, prévision pour janvier - 1,49%), puisque l'erreur relative moyenne lors de l'utilisation de cette méthode est la plus petite - 1 ,13%.

Méthode des moindres carrés

Autres articles sur ce sujet :

Liste des sources utilisées

  1. Recommandations scientifiques et méthodologiques sur le diagnostic des risques sociaux et la prévision des défis, des menaces et des conséquences sociales. Université sociale d'État de Russie. Moscou. 2010 ;
  2. Vladimirova L.P. Prévision et planification dans les conditions du marché : Manuel. allocation. M. : Maison d'édition "Dashkov and Co", 2001 ;
  3. Novikova N.V., Pozdeeva O.G. Prévision de l'économie nationale : Manuel pédagogique et méthodologique. Ekaterinbourg : Maison d'édition de l'Oural. État éco. Université, 2007 ;
  4. Slutskin L.N. Cours de MBA sur la prévision commerciale. M. : Alpina Business Books, 2006.

Programme MNC

Entrer des données

Données et approximation y = a + bx

je- nombre de points expérimentaux ;
x je- valeur d'un paramètre fixe en un point je;
et je- valeur du paramètre mesuré en un point je;
ωje- mesurer le poids en un point je;
oui, je, calcul.- différence entre la valeur mesurée et la valeur calculée par régression ouià ce point je;
S x je (x je)- estimation de l'erreur x je lors de la mesure ouià ce point je.

Données et approximation y = kx

je x je et je ωje oui, je, calcul. Oui, je S x je (x je)

Cliquez sur le graphique

Manuel d'utilisation du programme en ligne MNC.

Dans le champ de données, entrez sur chaque ligne distincte les valeurs de « x » et « y » à un point expérimental. Les valeurs doivent être séparées par un caractère d'espacement (espace ou tabulation).

La troisième valeur pourrait être le poids du point « w ». Si le poids d’un point n’est pas précisé, il est égal à un. Dans la grande majorité des cas, les poids des points expérimentaux sont inconnus ou non calculés, c'est-à-dire toutes les données expérimentales sont considérées comme équivalentes. Parfois, les poids dans la plage de valeurs étudiée ne sont absolument pas équivalents et peuvent même être calculés théoriquement. Par exemple, en spectrophotométrie, les poids peuvent être calculés à l’aide de formules simples, bien que cela soit généralement négligé pour réduire les coûts de main-d’œuvre.

Les données peuvent être collées via le presse-papiers à partir d'une feuille de calcul dans une suite bureautique telle qu'Excel de Microsoft Office ou Calc d'Open Office. Pour ce faire, dans la feuille de calcul, sélectionnez la plage de données à copier, copiez-la dans le presse-papiers et collez les données dans le champ de données de cette page.

Pour calculer par la méthode des moindres carrés, au moins deux points sont nécessaires pour déterminer deux coefficients « b » - la tangente de l'angle d'inclinaison de la ligne et « a » - la valeur interceptée par la ligne sur l'axe « y ».

Pour estimer l'erreur des coefficients de régression calculés, vous devez définir le nombre de points expérimentaux à plus de deux.

Méthode des moindres carrés (LSM).

Plus le nombre de points expérimentaux est grand, plus l'évaluation statistique des coefficients est précise (en raison d'une diminution du coefficient de Student) et plus l'estimation est proche de l'estimation de l'échantillon général.

L'obtention de valeurs à chaque point expérimental est souvent associée à des coûts de main-d'œuvre importants, c'est pourquoi un nombre d'expériences compromis est souvent réalisé, ce qui donne une estimation gérable et n'entraîne pas de coûts de main-d'œuvre excessifs. En règle générale, le nombre de points expérimentaux pour une dépendance linéaire des moindres carrés avec deux coefficients est choisi entre 5 et 7 points.

Une brève théorie des moindres carrés pour les relations linéaires

Disons que nous avons un ensemble de données expérimentales sous la forme de paires de valeurs [`y_i`, `x_i`], où `i` est le numéro d'une mesure expérimentale de 1 à `n` ; `y_i` - la valeur de la quantité mesurée au point `i` ; `x_i` - la valeur du paramètre que nous définissons au point `i`.

À titre d'exemple, considérons le fonctionnement de la loi d'Ohm. En modifiant la tension (différence de potentiel) entre les sections d'un circuit électrique, nous mesurons la quantité de courant traversant cette section. La physique nous donne une dépendance trouvée expérimentalement :

`Je = U/R`,
où « I » est la force actuelle ; `R` - résistance ; `U` - tension.

Dans ce cas, « y_i » est la valeur du courant mesuré et « x_i » est la valeur de la tension.

Comme autre exemple, considérons l’absorption de la lumière par une solution d’une substance en solution. La chimie nous donne la formule :

`A = ε l C`,
où « A » est la densité optique de la solution ; `ε` - facteur de transmission du soluté ; `l` - longueur du trajet lorsque la lumière traverse une cuvette avec une solution ; « C » est la concentration de la substance dissoute.

Dans ce cas, « y_i » est la valeur mesurée de la densité optique « A » et « x_i » est la valeur de concentration de la substance que nous spécifions.

Nous considérerons le cas où l'erreur relative dans l'affectation `x_i` est nettement inférieure à l'erreur relative dans la mesure `y_i`. Nous supposerons également que toutes les valeurs mesurées `y_i` sont aléatoires et normalement distribuées, c'est-à-dire obéir à la loi de distribution normale.

Dans le cas d'une dépendance linéaire de `y` sur `x`, on peut écrire la dépendance théorique :
`y = a + b x`.

D'un point de vue géométrique, le coefficient « b » désigne la tangente de l'angle d'inclinaison de la ligne à l'axe « x », et le coefficient « a » - la valeur de « y » au point d'intersection de ligne avec l'axe « y » (à « x = 0 »).

Trouver les paramètres de la droite de régression.

Dans une expérience, les valeurs mesurées de « y_i » ne peuvent pas se situer exactement sur la ligne droite théorique en raison d'erreurs de mesure, toujours inhérentes à la vie réelle. Par conséquent, une équation linéaire doit être représentée par un système d’équations :
`y_i = a + b x_i + ε_i` (1),
où `ε_i` est l'erreur de mesure inconnue de `y` dans la `i`-ième expérience.

La dépendance (1) est également appelée régression, c'est à dire. la dépendance de deux quantités l'une par rapport à l'autre avec une signification statistique.

La tâche de restauration de la dépendance est de trouver les coefficients `a` et `b` à partir des points expérimentaux [`y_i`, `x_i`].

Pour trouver les coefficients `a` et `b`, on utilise généralement méthode des moindres carrés(MNC). Il s’agit d’un cas particulier du principe du maximum de vraisemblance.

Réécrivons (1) sous la forme `ε_i = y_i - a - b x_i`.

Alors la somme des carrés des erreurs sera
`Φ = somme_(i=1)^(n) ε_i^2 = somme_(i=1)^(n) (y_i - a - b x_i)^2`. (2)

Le principe des moindres carrés (moindres carrés) est de minimiser la somme (2) par rapport aux paramètres `a` et `b`.

Le minimum est atteint lorsque les dérivées partielles de la somme (2) par rapport aux coefficients « a » et « b » sont égales à zéro :
`frac(partiel Φ)(partiel a) = frac(partiel sum_(i=1)^(n) (y_i - a - b x_i)^2)(partiel a) = 0`
`frac(partiel Φ)(partiel b) = frac(partiel sum_(i=1)^(n) (y_i - a - b x_i)^2)(partiel b) = 0`

En développant les dérivées, on obtient un système de deux équations à deux inconnues :
`somme_(i=1)^(n) (2a + 2bx_i — 2y_i) = somme_(i=1)^(n) (a + bx_i — y_i) = 0`
`sum_(i=1)^(n) (2bx_i^2 + 2ax_i — 2x_iy_i) = somme_(i=1)^(n) (bx_i^2 + ax_i — x_iy_i) = 0`

On ouvre les parenthèses et transférons les sommes indépendantes des coefficients requis vers l'autre moitié, on obtient un système d'équations linéaires :
`somme_(i=1)^(n) y_i = a n + b somme_(i=1)^(n) bx_i`
`somme_(i=1)^(n) x_iy_i = a somme_(i=1)^(n) x_i + b somme_(i=1)^(n) x_i^2`

En résolvant le système résultant, nous trouvons des formules pour les coefficients « a » et « b » :

`a = frac(somme_(i=1)^(n) y_i somme_(i=1)^(n) x_i^2 — somme_(i=1)^(n) x_i somme_(i=1)^(n ) x_iy_i) (n somme_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2)` (3.1)

`b = frac(n somme_(i=1)^(n) x_iy_i — somme_(i=1)^(n) x_i somme_(i=1)^(n) y_i) (n somme_(i=1)^ (n) x_i^2 — (sum_(i=1)^(n) x_i)^2)` (3.2)

Ces formules ont des solutions lorsque `n > 1` (la ligne peut être construite en utilisant au moins 2 points) et lorsque le déterminant `D = n sum_(i=1)^(n) x_i^2 - (sum_(i= 1 )^(n) x_i)^2 != 0`, c'est-à-dire lorsque les points `x_i` dans l'expérience sont différents (c'est-à-dire lorsque la ligne n'est pas verticale).

Estimation des erreurs des coefficients de la droite de régression

Pour une évaluation plus précise de l'erreur de calcul des coefficients « a » et « b », un grand nombre de points expérimentaux est souhaitable. Lorsque `n = 2`, il est impossible d’estimer l’erreur des coefficients, car la ligne de rapprochement passera uniquement par deux points.

L'erreur de la variable aléatoire 'V' est déterminée par loi de l'accumulation d'erreurs
`S_V^2 = sum_(i=1)^p (frac(partial f)(partial z_i))^2 S_(z_i)^2`,
où `p` est le nombre de paramètres `z_i` avec l'erreur `S_(z_i)`, qui affectent l'erreur `S_V` ;
`f` est fonction de la dépendance de `V` sur `z_i`.

Écrivons la loi d'accumulation d'erreurs pour l'erreur des coefficients `a` et `b`
`S_a^2 = somme_(i=1)^(n)(frac(partiel a)(partiel y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(partiel a )(partiel x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(partiel a)(partiel y_i))^2 `,
`S_b^2 = somme_(i=1)^(n)(frac(partiel b)(partiel y_i))^2 S_(y_i)^2 + sum_(i=1)^(n)(frac(partiel b )(partiel x_i))^2 S_(x_i)^2 = S_y^2 sum_(i=1)^(n)(frac(partiel b)(partiel y_i))^2 `,
parce que `S_(x_i)^2 = 0` (nous avons précédemment fait une réserve selon laquelle l'erreur `x` est négligeable).

`S_y^2 = S_(y_i)^2` - erreur (variance, écart type carré) dans la mesure de `y`, en supposant que l'erreur est uniforme pour toutes les valeurs de `y`.

En remplaçant les formules pour calculer « a » et « b » dans les expressions résultantes, nous obtenons

`S_a^2 = S_y^2 frac(sum_(i=1)^(n) (sum_(i=1)^(n) x_i^2 — x_i sum_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n somme_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2) sum_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(sum_(i=1)^(n) x_i^2) (D)` (4.1)

`S_b^2 = S_y^2 frac(sum_(i=1)^(n) (n x_i — sum_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n somme_(i=1)^(n) x_i^2 — (sum_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) ` (4.2)

Dans la plupart des expériences réelles, la valeur de « Sy » n'est pas mesurée. Pour ce faire, il est nécessaire d'effectuer plusieurs mesures (expérimentations) parallèles en un ou plusieurs points du plan, ce qui augmente le temps (et éventuellement le coût) de l'expérimentation. Par conséquent, on suppose généralement que l’écart de « y » par rapport à la droite de régression peut être considéré comme aléatoire. L'estimation de la variance « y » dans ce cas est calculée à l'aide de la formule.

`S_y^2 = S_(y, rest)^2 = frac(sum_(i=1)^n (y_i - a - b x_i)^2) (n-2)`.

Le diviseur « n-2 » apparaît parce que notre nombre de degrés de liberté a diminué en raison du calcul de deux coefficients utilisant le même échantillon de données expérimentales.

Cette estimation est également appelée variance résiduelle par rapport à la droite de régression « S_(y, rest)^2 ».

La significativité des coefficients est évaluée à l’aide du test t de Student

`t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)`

Si les critères calculés `t_a`, `t_b` sont inférieurs aux critères tabulés `t(P, n-2)`, alors on considère que le coefficient correspondant n'est pas significativement différent de zéro avec une probabilité `P` donnée.

Pour évaluer la qualité de la description d'une relation linéaire, vous pouvez comparer `S_(y, rest)^2` et `S_(bar y)` par rapport à la moyenne en utilisant le critère de Fisher.

`S_(bar y) = frac(sum_(i=1)^n (y_i — bar y)^2) (n-1) = frac(sum_(i=1)^n (y_i — (sum_(i= 1)^n y_i) /n)^2) (n-1)` - échantillon d'estimation de la variance `y` par rapport à la moyenne.

Pour évaluer l'efficacité de l'équation de régression pour décrire la dépendance, le coefficient de Fisher est calculé
`F = S_(bar y) / S_(y, reste)^2`,
qui est comparé au coefficient tabulaire de Fisher `F(p, n-1, n-2)`.

Si `F > F(P, n-1, n-2)`, la différence entre la description de la relation `y = f(x)` à l'aide de l'équation de régression et la description à l'aide de la moyenne est considérée comme statistiquement significative avec probabilité 'P'. Ceux. la régression décrit mieux la dépendance que la propagation de « y » autour de la moyenne.

Cliquez sur le graphique
pour ajouter des valeurs au tableau

Méthode des moindres carrés. La méthode des moindres carrés signifie la détermination de paramètres inconnus a, b, c, la dépendance fonctionnelle acceptée

La méthode des moindres carrés fait référence à la détermination de paramètres inconnus a, b, c,… dépendance fonctionnelle acceptée

y = f(x,a,b,c,…),

ce qui fournirait un minimum du carré moyen (variance) de l'erreur

, (24)

où x i, y i est un ensemble de paires de nombres obtenus à partir de l'expérience.

Puisque la condition pour l'extremum d'une fonction de plusieurs variables est la condition que ses dérivées partielles soient égales à zéro, alors les paramètres a, b, c,… sont déterminés à partir du système d’équations :

; ; ; … (25)

Il faut rappeler que la méthode des moindres carrés est utilisée pour sélectionner les paramètres selon le type de fonction y = f(x) défini

Si, à partir de considérations théoriques, aucune conclusion ne peut être tirée sur ce que devrait être la formule empirique, il faut alors se guider sur des représentations visuelles, principalement sur des représentations graphiques des données observées.

En pratique, elles se limitent le plus souvent aux types de fonctions suivants :

1) linéaire ;

2) quadratique a.

La méthode des moindres carrés (OLS) permet d'estimer diverses quantités en utilisant les résultats de nombreuses mesures contenant des erreurs aléatoires.

Caractéristiques des multinationales

L'idée principale de cette méthode est que la somme des erreurs quadratiques est considérée comme un critère de précision de la résolution du problème, qu'ils s'efforcent de minimiser. Lors de l'utilisation de cette méthode, des approches numériques et analytiques peuvent être utilisées.

En particulier, en tant qu'implémentation numérique, la méthode des moindres carrés consiste à prendre autant de mesures que possible d'une variable aléatoire inconnue. De plus, plus il y a de calculs, plus la solution sera précise. Sur la base de cet ensemble de calculs (données initiales), un autre ensemble de solutions estimées est obtenu, parmi lequel la meilleure est ensuite sélectionnée. Si l’ensemble des solutions est paramétré, alors la méthode des moindres carrés se résumera à trouver la valeur optimale des paramètres.

En tant qu'approche analytique de la mise en œuvre du LSM sur un ensemble de données initiales (mesures) et un ensemble attendu de solutions, une certaine (fonctionnelle) est déterminée, qui peut être exprimée par une formule obtenue comme une certaine hypothèse qui nécessite une confirmation. Dans ce cas, la méthode des moindres carrés revient à trouver le minimum de cette fonctionnelle sur l’ensemble des erreurs quadratiques des données originales.

Veuillez noter qu'il ne s'agit pas des erreurs elles-mêmes, mais des carrés des erreurs. Pourquoi? Le fait est que les écarts de mesures par rapport à la valeur exacte sont souvent positifs et négatifs. Lors de la détermination de la moyenne, une simple sommation peut conduire à une conclusion incorrecte sur la qualité de l'estimation, car l'annulation des valeurs positives et négatives réduira la puissance d'échantillonnage de plusieurs mesures. Et, par conséquent, l'exactitude de l'évaluation.

Pour éviter que cela ne se produise, les écarts au carré sont additionnés. De plus, afin d'égaliser la dimension de la valeur mesurée et l'estimation finale, la somme des erreurs quadratiques est extraite

Quelques applications multinationales

MNC est largement utilisé dans divers domaines. Par exemple, dans la théorie des probabilités et les statistiques mathématiques, la méthode est utilisée pour déterminer une caractéristique d'une variable aléatoire telle que l'écart type, qui détermine la largeur de la plage de valeurs de la variable aléatoire.

  • Didacticiel

Introduction

Je suis mathématicien et programmeur. Le plus grand pas que j'ai fait dans ma carrière a été lorsque j'ai appris à dire : "Je ne comprends rien!" Maintenant, je n'ai pas honte de dire au sommité de la science qu'il me donne une conférence, que je ne comprends pas ce que lui, le sommité, me dit. Et c'est très difficile. Oui, admettre son ignorance est difficile et embarrassant. Qui aime admettre qu’il ne connaît pas les bases de quelque chose ? De par mon métier, je dois assister à un grand nombre de présentations et de conférences, où, je l'avoue, dans la grande majorité des cas j'ai envie de dormir parce que je ne comprends rien. Mais je ne comprends pas, car l’énorme problème de la situation actuelle de la science réside dans les mathématiques. Cela suppose que tous les auditeurs connaissent absolument tous les domaines des mathématiques (ce qui est absurde). Admettre qu’on ne sait pas ce qu’est un dérivé (nous parlerons de ce que c’est un peu plus tard) est honteux.

Mais j'ai appris à dire que je ne sais pas ce qu'est la multiplication. Oui, je ne sais pas ce qu'est une sous-algèbre sur une algèbre de Lie. Oui, je ne sais pas pourquoi les équations quadratiques sont nécessaires dans la vie. Au fait, si vous êtes sûr de le savoir, alors nous avons de quoi parler ! Les mathématiques sont une série d'astuces. Les mathématiciens tentent de semer la confusion et d'intimider le public ; là où il n’y a pas de confusion, il n’y a pas de réputation, pas d’autorité. Oui, il est prestigieux de parler dans un langage aussi abstrait que possible, ce qui est un non-sens complet.

Savez-vous ce qu'est un dérivé ? Très probablement, vous me parlerez de la limite du rapport de différence. En première année de mathématiques et de mécanique à l'Université d'État de Saint-Pétersbourg, Viktor Petrovich Khavin m'a dit déterminé dérivée comme coefficient du premier terme de la série de Taylor de la fonction en un point (c'était une gymnastique distincte pour déterminer la série de Taylor sans dérivées). J'ai longtemps ri de cette définition jusqu'à ce que je comprenne enfin de quoi il s'agissait. La dérivée n'est rien de plus qu'une simple mesure de la similitude de la fonction que nous différencions avec la fonction y=x, y=x^2, y=x^3.

J'ai maintenant l'honneur de donner des conférences à des étudiants qui effrayé mathématiques. Si vous avez peur des mathématiques, nous sommes sur le même chemin. Dès que vous essayez de lire un texte et qu’il vous semble que c’est trop compliqué, sachez qu’il est mal écrit. J'affirme qu'il n'y a pas un seul domaine des mathématiques qui ne puisse être discuté « sur les doigts » sans perdre en précision.

Devoir pour le futur proche : J'ai demandé à mes étudiants de comprendre ce qu'est un régulateur quadratique linéaire. Ne soyez pas timide, passez trois minutes de votre vie et suivez le lien. Si vous ne comprenez rien, alors nous sommes sur le même chemin. Moi (un mathématicien-programmeur professionnel) je n’ai rien compris non plus. Et je vous assure que vous pouvez le comprendre « sur vos doigts ». Pour le moment, je ne sais pas ce que c'est, mais je vous assure que nous pourrons le découvrir.

Ainsi, la première conférence que je vais donner à mes étudiants après qu'ils soient venus me voir avec horreur et m'aient dit qu'un régulateur linéaire-quadratique est une chose terrible que vous ne maîtriserez jamais de votre vie est méthodes des moindres carrés. Pouvez-vous résoudre des équations linéaires ? Si vous lisez ce texte, ce n’est probablement pas le cas.

Ainsi, étant donné deux points (x0, y0), (x1, y1), par exemple (1,1) et (3,2), la tâche est de trouver l'équation de la droite passant par ces deux points :

illustration

Cette ligne devrait avoir une équation comme la suivante :

Ici alpha et bêta nous sont inconnus, mais deux points de cette droite sont connus :

On peut écrire cette équation sous forme matricielle :

Il convient ici de faire une digression lyrique : qu'est-ce qu'une matrice ? Une matrice n'est rien de plus qu'un tableau à deux dimensions. Il s’agit d’une manière de stocker des données ; aucune autre signification ne doit y être attachée. Cela dépend de nous exactement comment interpréter une certaine matrice. Périodiquement, je l'interpréterai comme une application linéaire, périodiquement comme une forme quadratique, et parfois simplement comme un ensemble de vecteurs. Tout cela sera clarifié dans son contexte.

Remplaçons les matrices concrètes par leur représentation symbolique :

Ensuite (alpha, bêta) peut être facilement trouvé :

Plus spécifiquement pour nos données précédentes :

Ce qui conduit à l'équation suivante de la droite passant par les points (1,1) et (3,2) :

D'accord, tout est clair ici. Trouvons l'équation de la droite passant par trois points : (x0,y0), (x1,y1) et (x2,y2) :

Oh-oh-oh, mais nous avons trois équations pour deux inconnues ! Un mathématicien standard dira qu’il n’y a pas de solution. Que dira le programmeur ? Et il va d’abord réécrire le système d’équations précédent sous la forme suivante :

Dans notre cas, les vecteurs i, j, b sont tridimensionnels, donc (dans le cas général) il n'y a pas de solution à ce système. Tout vecteur (alpha\*i + beta\*j) se trouve dans le plan couvert par les vecteurs (i, j). Si b n’appartient pas à ce plan, alors il n’y a pas de solution (l’égalité ne peut pas être obtenue dans l’équation). Ce qu'il faut faire? Cherchons un compromis. Notons par e(alpha, bêta) exactement jusqu'où nous n'avons pas atteint l'égalité :

Et nous allons essayer de minimiser cette erreur :

Pourquoi carré ?

Nous ne recherchons pas seulement le minimum de la norme, mais le minimum du carré de la norme. Pourquoi? Le point minimum lui-même coïncide, et le carré donne une fonction lisse (une fonction quadratique des arguments (alpha, bêta)), tandis que simplement la longueur donne une fonction en forme de cône, non différentiable au point minimum. Brr. Un carré est plus pratique.

Évidemment, l’erreur est minimisée lorsque le vecteur e orthogonal au plan couvert par les vecteurs je Et j.

Illustration

Autrement dit : on cherche une droite telle que la somme des carrés des longueurs des distances de tous les points à cette droite soit minimale :

MISE À JOUR : j'ai un problème ici, la distance à la ligne droite doit être mesurée verticalement, et non par projection orthogonale. Ce commentateur a raison.

Illustration

En termes complètement différents (soigneusement, mal formalisés, mais cela devrait être clair) : nous prenons toutes les lignes possibles entre toutes les paires de points et cherchons la ligne moyenne entre tous :

Illustration

Une autre explication est simple : nous attachons un ressort entre tous les points de données (ici nous en avons trois) et la droite que nous recherchons, et la droite de l’état d’équilibre est exactement ce que nous recherchons.

Forme quadratique minimale

Donc étant donné ce vecteur b et un plan engendré par les vecteurs colonnes de la matrice UN(dans ce cas (x0,x1,x2) et (1,1,1)), on cherche le vecteur e avec un carré minimum de longueur. Évidemment, le minimum n'est atteignable que pour le vecteur e, orthogonal au plan engendré par les vecteurs colonnes de la matrice UN:

Autrement dit, on recherche un vecteur x=(alpha, beta) tel que :

Je vous rappelle que ce vecteur x=(alpha, beta) est le minimum de la fonction quadratique ||e(alpha, beta)||^2 :

Ici, il serait utile de rappeler que la matrice peut également être interprétée comme une forme quadratique, par exemple, la matrice identité ((1,0),(0,1)) peut être interprétée comme une fonction x^2 + y^ 2 :

forme quadratique

Toute cette gymnastique est connue sous le nom de régression linéaire.

Équation de Laplace avec condition aux limites de Dirichlet

Maintenant la vraie tâche la plus simple : il y a une certaine surface triangulée, il faut la lisser. Par exemple, chargeons un modèle de mon visage :

Le commit original est disponible. Pour minimiser les dépendances externes, j'ai repris le code de mon logiciel de rendu, déjà sur Habré. Pour résoudre un système linéaire, j'utilise OpenNL, c'est un excellent solveur, mais qui est très difficile à installer : vous devez copier deux fichiers (.h+.c) dans le dossier avec votre projet. Tout lissage se fait avec le code suivant :

Pour (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&face = visages[i]; pour (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

Les coordonnées X, Y et Z sont séparables, je les lisse séparément. Autrement dit, je résous trois systèmes d'équations linéaires, chacun avec un nombre de variables égal au nombre de sommets de mon modèle. Les n premières lignes de la matrice A n'ont qu'un seul 1 par ligne et les n premières lignes du vecteur b ont les coordonnées du modèle d'origine. C'est-à-dire que j'attache un ressort entre la nouvelle position du sommet et l'ancienne position du sommet - les nouvelles ne doivent pas s'éloigner trop des anciennes.

Toutes les lignes suivantes de la matrice A (faces.size()*3 = nombre d'arêtes de tous les triangles du maillage) ont une occurrence de 1 et une occurrence de -1, le vecteur b ayant zéro composante opposée. Cela signifie que je mets un ressort sur chaque bord de notre maillage triangulaire : tous les bords essaient d'avoir le même sommet comme point de départ et d'arrivée.

Encore une fois : tous les sommets sont variables, et ils ne peuvent pas s'éloigner de leur position d'origine, mais en même temps ils essaient de devenir similaires les uns aux autres.

Voici le résultat :

Tout irait bien, le modèle est vraiment lissé, mais il s'est éloigné de son bord d'origine. Modifions un peu le code :

Pour (int i=0; je<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

Dans notre matrice A, pour les sommets qui sont sur l'arête, j'ajoute non pas une ligne de la catégorie v_i = verts[i][d], mais 1000*v_i = 1000*verts[i][d]. Qu'est-ce que ça change ? Et cela change notre forme quadratique d’erreur. Désormais, un seul écart du haut au bord ne coûtera plus une unité, comme auparavant, mais 1 000 x 1 000 unités. C'est-à-dire que nous avons accroché un ressort plus fort aux sommets extrêmes, la solution préférera étirer les autres plus fortement. Voici le résultat :

Doublons la force du ressort entre les sommets :
nlCoefficient(face[ j ], 2); nlCoefficient(face[(j+1)%3], -2);

Il est logique que la surface soit devenue plus lisse :

Et maintenant encore cent fois plus fort :

Qu'est-ce que c'est? Imaginez que nous ayons plongé un anneau métallique dans de l'eau savonneuse. En conséquence, le film de savon obtenu tentera d'avoir le moins de courbure possible, touchant la bordure - notre anneau métallique. C'est exactement ce que nous avons obtenu en fixant la bordure et en demandant une surface lisse à l'intérieur. Félicitations, nous venons de résoudre l'équation de Laplace avec les conditions aux limites de Dirichlet. Cela paraît bien? Mais en réalité, il suffit de résoudre un seul système d’équations linéaires.

L'équation de Poisson

Souvenons-nous d'un autre nom sympa.

Disons que j'ai une image comme celle-ci :

Ça a l’air bien pour tout le monde, mais je n’aime pas la chaise.

Je vais couper l'image en deux :



Et je sélectionnerai une chaise avec mes mains :

Ensuite, je tirerai tout ce qui est blanc dans le masque vers la gauche de l'image, et en même temps tout au long de l'image, je dirai que la différence entre deux pixels voisins doit être égale à la différence entre deux pixels voisins de droite. image:

Pour (int i=0; je

Voici le résultat :

Code et photos disponibles

Ses applications sont nombreuses, car elle permet une représentation approximative d’une fonction donnée par d’autres plus simples. Le LSM peut être extrêmement utile dans le traitement des observations, et il est activement utilisé pour estimer certaines quantités sur la base des résultats de mesures d'autres contenant des erreurs aléatoires. Dans cet article, vous apprendrez comment implémenter les calculs des moindres carrés dans Excel.

Énoncé du problème à l'aide d'un exemple précis

Supposons qu'il existe deux indicateurs X et Y. De plus, Y dépend de X. Puisque les MCO nous intéressent du point de vue de l'analyse de régression (dans Excel, ses méthodes sont implémentées à l'aide de fonctions intégrées), nous devons immédiatement considérer un problème spécifique.

Soit donc X la surface de vente d'une épicerie, mesurée en mètres carrés, et Y le chiffre d'affaires annuel, mesuré en millions de roubles.

Il est nécessaire de faire une prévision du chiffre d'affaires (Y) que réalisera le magasin s'il dispose de tel ou tel espace de vente. Évidemment, la fonction Y = f (X) est croissante, puisque l'hypermarché vend plus de marchandises que l'étal.

Quelques mots sur l'exactitude des données initiales utilisées pour la prédiction

Disons que nous avons une table construite à partir des données de n magasins.

Selon les statistiques mathématiques, les résultats seront plus ou moins corrects si les données sur au moins 5 à 6 objets sont examinées. De plus, les résultats « anormaux » ne peuvent pas être utilisés. En particulier, une petite boutique d'élite peut avoir un chiffre d'affaires plusieurs fois supérieur à celui des grands points de vente de la classe « masmarket ».

L'essence de la méthode

Les données du tableau peuvent être représentées sur un plan cartésien sous la forme de points M 1 (x 1, y 1), ... M n (x n, y n). Maintenant la solution du problème se réduira à la sélection d'une fonction d'approximation y = f (x), qui a un graphe passant le plus près possible des points M 1, M 2, .. M n.

Bien sûr, vous pouvez utiliser un polynôme de haut degré, mais cette option est non seulement difficile à mettre en œuvre, mais aussi tout simplement incorrecte, car elle ne reflétera pas la tendance principale à détecter. La solution la plus raisonnable est de rechercher la droite y = ax + b, qui se rapproche le mieux des données expérimentales, ou plus précisément des coefficients a et b.

Évaluation de la précision

Quelle que soit l'approximation, l'évaluation de son exactitude revêt une importance particulière. Notons e i la différence (écart) entre les valeurs fonctionnelles et expérimentales pour le point x i, c'est-à-dire e i = y i - f (x i).

Évidemment, pour évaluer la précision de l'approximation, vous pouvez utiliser la somme des écarts, c'est-à-dire que lors du choix d'une ligne droite pour une représentation approximative de la dépendance de X à Y, vous devez privilégier celle avec la plus petite valeur de somme e i à tous les points considérés. Cependant, tout n'est pas si simple, car à côté des écarts positifs, il y aura aussi des écarts négatifs.

Le problème peut être résolu en utilisant des modules de déviation ou leurs carrés. Cette dernière méthode est la plus utilisée. Il est utilisé dans de nombreux domaines, notamment l'analyse de régression (implémentée dans Excel à l'aide de deux fonctions intégrées), et a depuis longtemps prouvé son efficacité.

Méthode des moindres carrés

Excel, comme vous le savez, possède une fonction AutoSum intégrée qui vous permet de calculer les valeurs de toutes les valeurs situées dans la plage sélectionnée. Ainsi, rien ne nous empêchera de calculer la valeur de l'expression (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

En notation mathématique, cela ressemble à :

Puisque la décision a été initialement prise d’approximer par une ligne droite, nous avons :

Ainsi, la tâche de trouver la droite qui décrit le mieux la dépendance spécifique des quantités X et Y revient à calculer le minimum d'une fonction de deux variables :

Pour ce faire, vous devez assimiler les dérivées partielles par rapport aux nouvelles variables a et b à zéro, et résoudre un système primitif composé de deux équations à 2 inconnues de la forme :

Après quelques transformations simples, dont la division par 2 et la manipulation des sommes, on obtient :

En le résolvant, par exemple, à l'aide de la méthode de Cramer, on obtient un point stationnaire avec certains coefficients a* et b*. C'est le minimum, c'est-à-dire pour prédire le chiffre d'affaires qu'un magasin réalisera pour une certaine zone, la droite y = a * x + b * convient, qui est un modèle de régression pour l'exemple en question. Bien sûr, cela ne vous permettra pas de trouver le résultat exact, mais cela vous aidera à avoir une idée de savoir si l'achat d'une zone spécifique à crédit en magasin sera rentable.

Comment implémenter les moindres carrés dans Excel

Excel dispose d'une fonction permettant de calculer des valeurs à l'aide des moindres carrés. Il a la forme suivante : « TENDANCE » (valeurs Y connues ; valeurs X connues ; nouvelles valeurs X ; constante). Appliquons la formule de calcul des OLS dans Excel à notre tableau.

Pour cela, saisissez le signe « = » dans la cellule dans laquelle doit être affiché le résultat du calcul par la méthode des moindres carrés dans Excel et sélectionnez la fonction « TENDANCE ». Dans la fenêtre qui s'ouvre, remplissez les champs appropriés en mettant en surbrillance :

  • plage de valeurs connues pour Y (dans ce cas, les données sur le chiffre d'affaires commercial) ;
  • plage x 1 , …x n , c'est-à-dire la taille de l'espace de vente au détail ;
  • valeurs à la fois connues et inconnues de x, pour lesquelles vous devez connaître la taille du chiffre d'affaires (pour plus d'informations sur leur emplacement sur la feuille de calcul, voir ci-dessous).

De plus, la formule contient la variable logique « Const ». Si vous saisissez 1 dans le champ correspondant, cela signifie que vous devrez effectuer les calculs en supposant que b = 0.

Si vous avez besoin de connaître la prévision pour plus d'une valeur x, après avoir entré la formule, vous ne devez pas appuyer sur "Entrée", mais vous devez taper la combinaison "Shift" + "Contrôle" + "Entrée" sur le clavier.

Certaines fonctionnalités

L'analyse de régression peut être accessible même aux nuls. La formule Excel permettant de prédire la valeur d'un tableau de variables inconnues (TREND) peut être utilisée même par ceux qui n'ont jamais entendu parler des moindres carrés. Il suffit de connaître quelques-unes des caractéristiques de son travail. En particulier:

  • Si vous organisez la plage de valeurs connues de la variable y dans une ligne ou une colonne, alors chaque ligne (colonne) avec des valeurs connues de x sera perçue par le programme comme une variable distincte.
  • Si une plage avec x connu n'est pas spécifiée dans la fenêtre TENDANCE, alors lors de l'utilisation de la fonction dans Excel, le programme la traitera comme un tableau composé d'entiers dont le nombre correspond à la plage avec les valeurs données du variable y.
  • Pour générer un tableau de valeurs « prédites », l’expression permettant de calculer la tendance doit être saisie sous forme de formule matricielle.
  • Si de nouvelles valeurs de x ne sont pas spécifiées, alors la fonction TREND les considère égales aux valeurs connues. S'ils ne sont pas spécifiés, alors le tableau 1 est pris comme argument ; 2 ; 3 ; 4;…, ce qui est proportionnel à la plage avec les paramètres y déjà spécifiés.
  • La plage contenant les nouvelles valeurs x doit avoir la même ou plusieurs lignes ou colonnes que la plage contenant les valeurs y données. Autrement dit, il doit être proportionnel aux variables indépendantes.
  • Un tableau avec des valeurs x connues peut contenir plusieurs variables. Cependant, si nous ne parlons que d'un seul, il est alors nécessaire que les plages avec les valeurs données de x et y soient proportionnelles. Dans le cas de plusieurs variables, il est nécessaire que la plage avec les valeurs y données tienne dans une colonne ou une ligne.

Fonction PRÉDICTION

Implémenté à l'aide de plusieurs fonctions. L’un d’eux s’appelle « PRÉDICTION ». Il est similaire à « TENDANCE », c’est à dire qu’il donne le résultat de calculs utilisant la méthode des moindres carrés. Cependant, seulement pour un X, pour lequel la valeur de Y est inconnue.

Vous connaissez désormais les formules dans Excel pour les nuls qui vous permettent de prédire la valeur future d'un indicateur particulier selon une tendance linéaire.