Test d'hypothèses simples à l'aide du test du chi carré de Pearson dans MS EXCEL. Détermination de la relation entre les caractéristiques : test du chi carré

  • 30.09.2019

Ministère de l'Éducation et des Sciences de la Fédération de Russie

Agence fédérale pour l'éducation de la ville d'Irkoutsk

Université d'État d'économie et de droit du Baïkal

Département d'informatique et de cybernétique

Distribution du chi carré et ses applications

Kolmykova Anna Andreevna

étudiant en 2ème année

groupe IS-09-1

Irkoutsk 2010

Introduction

1. Distribution du chi carré

Application

Conclusion

Bibliographie

Introduction

Comment les approches, les idées et les résultats de la théorie des probabilités sont-ils utilisés dans nos vies ?

La base est un modèle probabiliste d'un phénomène ou d'un processus réel, c'est-à-dire un modèle mathématique dans lequel les relations objectives sont exprimées en termes de théorie des probabilités. Les probabilités sont principalement utilisées pour décrire les incertitudes dont il faut tenir compte lors de la prise de décision. Il s’agit à la fois d’opportunités indésirables (risques) et d’opportunités attractives (« chance chanceuse »). Parfois, le hasard est délibérément introduit dans une situation, par exemple lors du tirage au sort, de la sélection aléatoire d'unités à contrôler, de l'organisation de loteries ou d'enquêtes auprès des consommateurs.

La théorie des probabilités permet d’utiliser une probabilité pour en calculer d’autres qui intéressent le chercheur.

Un modèle probabiliste d'un phénomène ou d'un processus constitue le fondement des statistiques mathématiques. Deux séries parallèles de concepts sont utilisées : ceux liés à la théorie (modèle probabiliste) et ceux liés à la pratique (échantillonnage des résultats d'observation). Par exemple, la probabilité théorique correspond à la fréquence trouvée dans l'échantillon. L'espérance mathématique (série théorique) correspond à la moyenne arithmétique de l'échantillon (série pratique). En règle générale, les caractéristiques de l’échantillon sont des estimations théoriques. Dans le même temps, les quantités liées aux séries théoriques « sont dans la tête des chercheurs », se rapportent au monde des idées (selon l'ancien philosophe grec Platon) et ne sont pas disponibles pour une mesure directe. Les chercheurs ne disposent que d’échantillons de données avec lesquels ils tentent d’établir les propriétés d’un modèle probabiliste théorique qui les intéressent.

Pourquoi avons-nous besoin d’un modèle probabiliste ? Le fait est que ce n'est qu'avec son aide que les propriétés établies à partir de l'analyse d'un échantillon spécifique peuvent être transférées à d'autres échantillons, ainsi qu'à l'ensemble de la population dite générale. Le terme « population » est utilisé pour désigner un ensemble vaste mais limité d’unités étudiées. Par exemple, à propos de la totalité de tous les résidents de Russie ou de la totalité de tous les consommateurs de café instantané à Moscou. Le but des enquêtes marketing ou sociologiques est de transférer les déclarations obtenues à partir d'un échantillon de centaines ou de milliers de personnes à des populations de plusieurs millions de personnes. En contrôle qualité, un lot de produits agit comme une population générale.

Pour transférer les conclusions d'un échantillon à une population plus large, il faut certaines hypothèses sur la relation entre les caractéristiques de l'échantillon et les caractéristiques de cette population plus large. Ces hypothèses sont basées sur un modèle probabiliste approprié.

Bien entendu, il est possible de traiter des échantillons de données sans utiliser l’un ou l’autre modèle probabiliste. Par exemple, vous pouvez calculer un échantillon de moyenne arithmétique, compter la fréquence de réalisation de certaines conditions, etc. Cependant, les résultats du calcul ne concerneront qu'un échantillon spécifique ; il est incorrect de transférer les conclusions obtenues avec leur aide à toute autre population. Cette activité est parfois appelée « analyse de données ». Par rapport aux méthodes statistiques probabilistes, l’analyse des données a une valeur éducative limitée.

Ainsi, l'utilisation de modèles probabilistes basés sur l'estimation et le test d'hypothèses utilisant les caractéristiques d'un échantillon est l'essence même des méthodes probabilistes et statistiques de prise de décision.

Distribution du chi carré

À l'aide de la distribution normale, trois distributions sont définies qui sont désormais souvent utilisées dans le traitement des données statistiques. Il s'agit des distributions de Pearson (« chi carré »), de Student et de Fisher.

Nous nous concentrerons sur la distribution

(« chi – carré »). Cette distribution a été étudiée pour la première fois par l'astronome F. Helmert en 1876. En relation avec la théorie de l'erreur gaussienne, il a étudié les sommes des carrés de n variables aléatoires indépendantes normalement distribuées. Karl Pearson a plus tard nommé cette fonction de distribution « chi carré ». Et désormais la distribution porte son nom.

En raison de son lien étroit avec la distribution normale, la distribution χ2 joue un rôle important dans la théorie des probabilités et les statistiques mathématiques. La distribution χ2, et de nombreuses autres distributions définies par la distribution χ2 (par exemple, la distribution de Student), décrivent des distributions d'échantillons de diverses fonctions à partir de résultats d'observation normalement distribués et sont utilisées pour construire des intervalles de confiance et des tests statistiques.

Répartition Pearson

(chi - carré) – distribution d'une variable aléatoire, où X1, X2,..., Xn sont des variables aléatoires indépendantes normales, et l'espérance mathématique de chacune d'elles est nulle et l'écart type est un.

Somme des carrés


distribué conformément à la loi

(« chi – carré »).

Dans ce cas, le nombre de termes, c'est-à-dire n est appelé le « nombre de degrés de liberté » de la distribution du chi carré.À mesure que le nombre de degrés de liberté augmente, la distribution se rapproche lentement de la normale.

La densité de cette distribution


Ainsi, la distribution de χ2 dépend d’un paramètre n – le nombre de degrés de liberté.

La fonction de distribution χ2 a la forme :


si χ2≥0. (2.7.)

La figure 1 montre un graphique de la densité de probabilité et de la fonction de distribution χ2 pour différents degrés de liberté.

Image 1 Dépendance de la densité de probabilité φ (x) dans la distribution χ2 (chi – carré) pour différents nombres de degrés de liberté.

Moments de la distribution du chi carré :

La distribution du chi carré est utilisée pour estimer la variance (à l'aide d'un intervalle de confiance), tester des hypothèses d'accord, d'homogénéité, d'indépendance, principalement pour les variables qualitatives (catégorisées) qui prennent un nombre fini de valeurs, et dans de nombreuses autres tâches d'analyse de données statistiques. .

2. « Chi carré » dans les problèmes d'analyse de données statistiques

Les méthodes statistiques d'analyse des données sont utilisées dans presque tous les domaines de l'activité humaine. Ils sont utilisés chaque fois qu'il est nécessaire d'obtenir et de justifier des jugements sur un groupe (objets ou sujets) présentant une certaine hétérogénéité interne.

Le stade moderne de développement des méthodes statistiques remonte à 1900, lorsque l'Anglais K. Pearson fonda la revue "Biometrika". Premier tiers du XXe siècle. passée sous le signe des statistiques paramétriques. Les méthodes ont été étudiées sur la base de l'analyse des données des familles paramétriques de distributions décrites par les courbes de la famille de Pearson. La distribution normale était la plus populaire. Pour tester les hypothèses, les tests de Pearson, Student et Fisher ont été utilisés. La méthode du maximum de vraisemblance et l'analyse de la variance ont été proposées, et les idées de base de la planification des expériences ont été formulées.

La distribution du Chi carré est l'une des plus largement utilisées en statistique pour tester des hypothèses statistiques. Sur la base de la distribution du chi carré, l'un des tests d'ajustement les plus puissants est construit : le test du chi carré de Pearson.

Le critère d'accord est le critère permettant de tester l'hypothèse sur la loi supposée d'une distribution inconnue.

Le test χ2 (chi carré) est utilisé pour tester l'hypothèse de diverses distributions. C'est sa dignité.

La formule de calcul du critère est égale à

où m et m' sont respectivement des fréquences empiriques et théoriques

la distribution en question ;

n est le nombre de degrés de liberté.

Pour vérifier, nous devons comparer les fréquences empiriques (observées) et théoriques (calculées sous l’hypothèse d’une distribution normale).

Si les fréquences empiriques coïncident complètement avec les fréquences calculées ou attendues, S (E – T) = 0 et le critère χ2 sera également égal à zéro. Si S (E – T) n’est pas égal à zéro, cela indiquera un écart entre les fréquences calculées et les fréquences empiriques de la série. Dans de tels cas, il est nécessaire d’évaluer la significativité du critère χ2, qui peut théoriquement varier de zéro à l’infini. Cela se fait en comparant la valeur réellement obtenue de χ2ф avec sa valeur critique (χ2st). L'hypothèse nulle, c'est-à-dire l'hypothèse selon laquelle l'écart entre les fréquences empiriques et théoriques ou attendues est aléatoire, est réfutée si χ2ф est supérieur ou égal à χ2st pour le niveau de signification accepté (a) et le nombre de degrés de liberté (n).

Chi carré Pearson est le test le plus simple pour tester la signification d'une relation entre deux variables catégorisées. Le critère de Pearson est basé sur le fait que dans un tableau à deux entrées attendu les fréquences sous l’hypothèse « il n’y a pas de dépendance entre les variables » peuvent être calculées directement. Imaginez que 20 hommes et 20 femmes soient interrogés sur leur choix d'eau gazeuse (marque UN ou marque B). S’il n’y a aucun lien entre les préférences et le sexe, alors naturellement attendre choix égal de la marque UN et les marques B pour chaque sexe.

Signification des statistiques chi carré et son niveau de signification dépend du nombre total d'observations et du nombre de cellules du tableau. Selon les principes abordés dans la section , des écarts relativement faibles entre les fréquences observées et celles attendues s'avéreront significatifs si le nombre d'observations est important.

Il n'y a qu'une seule limite significative à l'utilisation du critère chi carré(mis à part l'hypothèse évidente d'une sélection aléatoire des observations), qui est que les fréquences attendues ne doivent pas être très petites. Cela est dû au fait que le critère chi carré par nature, des chèques probabilités dans chaque cellule ; et si les fréquences attendues dans les cellules deviennent petites, par exemple inférieures à 5, alors ces probabilités ne peuvent pas être estimées avec une précision suffisante en utilisant les fréquences disponibles. Pour une discussion plus approfondie, voir Everitt (1977), Hays (1988) ou Kendall et Stuart (1979).

Test du Chi carré (méthode du maximum de vraisemblance).Chi carré du maximum de vraisemblance vise à tester la même hypothèse concernant les relations dans les tableaux de contingence que le critère chi carré Pearson. Cependant, son calcul repose sur la méthode du maximum de vraisemblance. En pratique, les statistiques MP chi carré très proche en ampleur de la statistique régulière de Pearson chi carré. De plus amples informations sur ces statistiques peuvent être trouvées dans Bishop, Fienberg et Holland (1975) ou Fienberg (1977). Au chapitre Analyse log-linéaire ces statistiques sont discutées plus en détail.

Amendement de Yates. Rapprochement des statistiques chi carré pour les tableaux 2x2 avec un petit nombre d'observations dans les cellules peut être amélioré en réduisant de 0,5 la valeur absolue des différences entre les fréquences attendues et observées avant la mise au carré (ce qu'on appelle Amendement Yates). La correction de Yates, qui rend l'estimation plus modérée, est généralement appliquée dans les cas où les tableaux ne contiennent que de petites fréquences, par exemple lorsque certaines fréquences attendues deviennent inférieures à 10 (pour une discussion plus approfondie, voir Conover, 1974 ; Everitt, 1977 ; Hays , 1988 ; Kendall et Stuart, 1979 et Mantel, 1974).

Le test exact de Fisher. Ce critère n'est applicable que pour les tables 2x2. Le critère repose sur le raisonnement suivant. Compte tenu des fréquences marginales dans le tableau, supposons que les deux variables tabulées sont indépendantes. Posons-nous la question : quelle est la probabilité d'obtenir les fréquences observées dans le tableau, à partir des fréquences marginales données ? Il s'avère que cette probabilité est calculée exactement en comptant tous les tableaux qui peuvent être construits sur la base des tableaux marginaux. Ainsi, le critère de Fisher calcule précis la probabilité d'occurrence des fréquences observées sous l'hypothèse nulle (aucune relation entre les variables tabulées). Le tableau des résultats montre à la fois les niveaux unilatéraux et bilatéraux.

Chi carré de McNemar. Ce critère s'applique lorsque les fréquences du tableau 2x2 représentent dépendant des échantillons. Par exemple, observations des mêmes individus avant et après une expérience. On peut notamment compter le nombre d'étudiants ayant des résultats minimes en mathématiques au début et à la fin du semestre ou la préférence des mêmes répondants avant et après l'annonce. Deux valeurs sont calculées chi carré: ANNONCE Et AVANT JC. Chi carré A/D teste l'hypothèse selon laquelle les fréquences dans les cellules UN Et D(en haut à gauche, en bas à droite) sont les mêmes. Chi carré B/C teste l'hypothèse sur l'égalité des fréquences dans les cellules B Et C(en haut à droite, en bas à gauche).

Coefficient Phi.Carré Phi représente une mesure de la relation entre deux variables dans un tableau 2x2. Ses valeurs varient de 0 (pas de dépendance entre variables ; chi carré = 0.0 ) avant 1 (relation absolue entre deux facteurs du tableau). Pour plus de détails, voir Castellan et Siegel (1988, p. 232).

Corrélation tétrachorique. Cette statistique est calculée (et appliquée) uniquement aux tableaux croisés 2x2. Si un tableau 2x2 peut être vu comme le résultat d'une partition (artificielle) des valeurs de deux variables continues en deux classes, alors le coefficient de corrélation tétrachorique permet d'estimer la relation entre ces deux variables.

Coefficient de conjugaison. Le coefficient de contingence est un calcul statistique chi carré une mesure de la relation entre les caractéristiques dans le tableau de contingence (proposé par Pearson). L'avantage de ce coefficient par rapport aux statistiques conventionnelles chi carré c'est que c'est plus facile à interpréter, parce que la plage de son changement est comprise entre 0 avant 1 (Où 0 correspond au cas d'indépendance des caractéristiques du tableau, et une augmentation du coefficient traduit une augmentation du degré de connexion). L'inconvénient du coefficient de contingence est que sa valeur maximale « dépend » de la taille du tableau. Ce coefficient ne peut atteindre la valeur 1 que si le nombre de classes n'est pas limité (voir Siegel, 1956, p. 201).

Interprétation des mesures de communication. Un inconvénient majeur des mesures d'association (abordées ci-dessus) est la difficulté de les interpréter en termes conventionnels de probabilité ou de « proportion de variance expliquée », comme dans le cas du coefficient de corrélation. r Pearson (voir Corrélations). Il n’existe donc pas de mesure ou de coefficient d’association généralement accepté.

Statistiques basées sur les classements. Dans de nombreux problèmes qui se posent dans la pratique, nous disposons de mesures uniquement en ordinal échelle (voir Concepts de base des statistiques). Cela s'applique particulièrement aux mesures dans le domaine de la psychologie, de la sociologie et d'autres disciplines liées à l'étude de l'homme. Supposons que vous ayez interrogé un certain nombre de personnes interrogées pour connaître leur attitude à l'égard de certains sports. Vous représentez les mesures sur une échelle avec les positions suivantes : (1) Toujours, (2) généralement, (3) Parfois et (4) jamais. Évidemment la réponse Des fois je me demande montre moins d'intérêt de la part du répondant que de la réponse Je suis généralement intéressé etc. Ainsi, il est possible d'ordonner (classer) le degré d'intérêt des répondants. Ceci est un exemple typique d’échelle ordinale. Les variables mesurées sur une échelle ordinale ont leurs propres types de corrélations qui permettent d'évaluer les dépendances.

R Spearman. Statistiques R. Spearman peut être interprété de la même manière que la corrélation de Pearson ( r Pearson) en termes de proportion expliquée de variance (en gardant toutefois à l’esprit que la statistique de Spearman est calculée par rangs). On suppose que les variables sont mesurées au moins dans ordinaléchelle. Une discussion complète de la corrélation des rangs de Spearman, de sa puissance et de son efficacité peut être trouvée, par exemple, dans Gibbons (1985), Hays (1981), McNemar (1969), Siegel (1956), Siegel et Castellan (1988), Kendall (1948). ), Olds (1949) et Hotelling et Pabst (1936).

Tau Kendall. Statistiques tau L'équivalent de Kendall R. Spearman sous certaines hypothèses de base. Leurs pouvoirs sont également équivalents. Cependant, généralement les valeurs R. Lancier et tau Les Kendall sont différents car ils diffèrent à la fois par leur logique interne et par la manière dont ils sont calculés. Dans Siegel et Castellan (1988), les auteurs expriment ainsi la relation entre ces deux statistiques :

1 < = 3 * Тау Кендалла - 2 * R Спирмена < = 1

Plus important encore, les statistiques de Kendall tau et Spearman R. ont des interprétations différentes : alors que les statistiques R. Spearman peut être considéré comme un analogue direct des statistiques r Pearson, calculé par classement, statistiques de Kendall tau plutôt basé sur probabilités. Plus précisément, il teste qu'il existe une différence entre la probabilité que les données observées soient dans le même ordre pour deux quantités et la probabilité qu'elles soient dans un ordre différent. Kendall (1948, 1975), Everitt (1977) et Siegel et Castellan (1988) discutent en détail tau Kendall. Généralement, deux statistiques sont calculées tau Kendall : tau b Et tau c. Ces mesures diffèrent uniquement par la façon dont elles traitent les classements correspondants. Dans la plupart des cas, leurs significations sont assez similaires. Si des différences apparaissent, il semble que le moyen le plus sûr consiste à considérer la plus petite des deux valeurs.

Coefficient d de Sommer : d(X|Y), d(Y|X). Statistiques d La mesure de Sommer est une mesure non symétrique de la relation entre deux variables. Cette statistique est proche de tau b(voir Siegel et Castellan, 1988, pp. 303-310).

Statistiques gamma. S'il existe de nombreuses valeurs correspondantes dans les données, les statistiques gamma préférable R. Lancier ou tau Kendall. En termes d'hypothèses de base, les statistiques gammaéquivalent aux statistiques R. Spearman ou le tau de Kendall. Son interprétation et ses calculs ressemblent davantage aux statistiques Tau de Kendall qu'aux statistiques R de Spearman. Pour le dire brièvement, gamma représente également probabilité; plus précisément, la différence entre la probabilité que l'ordre de classement de deux variables corresponde, moins la probabilité que ce ne soit pas le cas, divisée par un moins la probabilité de correspondance. Donc les statistiques gamma fondamentalement équivalent tau Kendall, sauf que les correspondances sont explicitement prises en compte dans la normalisation. Discussion détaillée des statistiques gamma peuvent être trouvées dans Goodman et Kruskal (1954, 1959, 1963, 1972), Siegel (1956) et Siegel et Castellan (1988).

Coefficients d'incertitude. Ces coefficients mesurent communication d'informations entre les facteurs (lignes et colonnes du tableau). Concept dépendance informationnelle trouve son origine dans l'approche de la théorie de l'information pour l'analyse des tableaux de fréquences, on peut consulter les manuels pertinents pour clarifier cette question (voir Kullback, 1959 ; Ku et Kullback, 1968 ; Ku, Varner et Kullback, 1971 ; voir aussi Bishop, Fienberg , et Holland, 1975, pp. 344-348). Statistiques S(Oui, X) est symétrique et mesure la quantité d'informations dans une variable Oui par rapport à la variable X ou dans une variable X par rapport à la variable Oui. Statistiques S(X|Y) Et S(Y|X) exprimer une dépendance directionnelle.

Réponses multidimensionnelles et dichotomies. Des variables telles que la réponse multivariée et les dichotomies multivariées apparaissent dans des situations où le chercheur s'intéresse non seulement aux fréquences « simples » des événements, mais également à certaines propriétés qualitatives (souvent non structurées) de ces événements. La nature des variables multidimensionnelles (facteurs) est mieux comprise à travers des exemples.

  • · Réponses multidimensionnelles
  • · Dichotomies multidimensionnelles
  • · Tableau croisé de réponses multivariées et de dichotomies
  • Tableau croisé par paires de variables avec réponses multivariées
  • · Commentaire final

Réponses multidimensionnelles. Imaginez que, dans le cadre d'une vaste étude marketing, vous demandiez à vos clients de nommer les 3 meilleures boissons gazeuses selon leur point de vue. Une question typique pourrait ressembler à ceci.

Considérez la candidature dansMSEXCELLERTest du chi carré de Pearson pour tester des hypothèses simples.

Après avoir obtenu des données expérimentales (c'est-à-dire lorsqu'il existe des échantillon) on choisit généralement la loi de distribution qui décrit le mieux la variable aléatoire représentée par un échantillonnage. La vérification de la qualité de la description des données expérimentales par la loi de distribution théorique sélectionnée est effectuée à l'aide de critères d'accord. Hypothèse nulle, il existe généralement une hypothèse sur l'égalité de la distribution d'une variable aléatoire avec une loi théorique.

Regardons d'abord l'application Test d'adéquation de Pearson X 2 (chi carré) par rapport à des hypothèses simples (les paramètres de la distribution théorique sont considérés comme connus). Puis - , lorsque seule la forme de la distribution est précisée, et les paramètres de cette distribution et la valeur statistiques X2 sont évalués/calculés sur la base des mêmes échantillons.

Note: Dans la littérature anglophone, la procédure de candidature Test d'adéquation de Pearson X2 a un nom Le test d'ajustement du chi carré.

Rappelons la procédure de test des hypothèses :

  • basé échantillons la valeur est calculée statistiques, ce qui correspond au type d’hypothèse testée. Par exemple, pour utilisé t-statistiques(si inconnu);
  • soumis à la vérité hypothèse nulle, la répartition de ce statistiques est connu et peut être utilisé pour calculer des probabilités (par exemple, pour t-statistiques Ce );
  • calculé sur la base échantillons signification statistiques par rapport à la valeur critique pour une valeur donnée ();
  • hypothèse nulle rejeter si valeur statistiques supérieure à critique (ou si la probabilité d'obtenir cette valeur statistiques() moins niveau de signification, ce qui est une approche équivalente).

Réalisons tests d'hypothèses pour diverses distributions.

Boîtier discret

Supposons que deux personnes jouent aux dés. Chaque joueur possède son propre jeu de dés. Les joueurs lancent à tour de rôle 3 dés à la fois. Chaque tour est remporté par celui qui obtient le plus de six à la fois. Les résultats sont enregistrés. L’un des joueurs, après 100 tours, soupçonnait que les dés de son adversaire étaient asymétriques, car il gagne souvent (il lance souvent des six). Il a décidé d’analyser la probabilité d’un tel nombre d’issues ennemies.

Note: Parce que Il y a 3 cubes, vous pouvez alors en lancer 0 à la fois ; 1; 2 ou 3 six, c'est-à-dire une variable aléatoire peut prendre 4 valeurs.

De la théorie des probabilités, nous savons que si les dés sont symétriques, alors la probabilité d'obtenir des six obéit. Par conséquent, après 100 tours, les fréquences des six peuvent être calculées à l'aide de la formule
=BINOM.DIST(A7,3,1/6,FALSE)*100

La formule suppose que dans la cellule A7 contient le nombre correspondant de six lancés en un tour.

Note: Les calculs sont donnés en exemple de fichier sur la feuille Discrète.

En comparaison observé(Observé) et fréquences théoriques(Attendu) pratique à utiliser.

Si les fréquences observées s'écartent significativement de la distribution théorique, hypothèse nulle sur la distribution d'une variable aléatoire selon une loi théorique doit être rejetée. Autrement dit, si les dés de l'adversaire sont asymétriques, alors les fréquences observées seront « significativement différentes » de distribution binomiale.

Dans notre cas, à première vue, les fréquences sont assez proches et sans calculs il est difficile de tirer une conclusion sans ambiguïté. En vigueur Test d'adéquation de Pearson X 2, de sorte qu'au lieu de l'affirmation subjective « substantiellement différent », qui peut être faite sur la base d'une comparaison histogrammes, utilisez une affirmation mathématiquement correcte.

Nous utilisons le fait qu'en raison de loi des grands nombres fréquence observée (Observée) avec un volume croissant échantillons n tend vers la probabilité correspondant à la loi théorique (dans notre cas, loi binomiale). Dans notre cas, la taille de l’échantillon n est de 100.

Présentons test statistiques, que l'on note X 2 :

où O l est la fréquence observée des événements pour lesquels la variable aléatoire a pris certaines valeurs acceptables, E l est la fréquence théorique correspondante (attendue). L est le nombre de valeurs que peut prendre une variable aléatoire (dans notre cas c'est 4).

Comme le montre la formule, ceci statistiques est une mesure de la proximité des fréquences observées par rapport aux fréquences théoriques, c'est-à-dire il peut être utilisé pour estimer les « distances » entre ces fréquences. Si la somme de ces « distances » est « trop grande », alors ces fréquences sont « significativement différentes ». Il est clair que si notre cube est symétrique (c'est-à-dire applicable loi binomiale), alors la probabilité que la somme des « distances » soit « trop grande » sera faible. Pour calculer cette probabilité, nous devons connaître la distribution statistiques X2 ( statistiques X 2 calculé sur la base du hasard échantillons, c'est donc une variable aléatoire et a donc son propre distribution de probabilité).

De l’analogue multidimensionnel Théorème intégral de Moivre-Laplace on sait que pour n->∞ notre variable aléatoire X 2 est asymptotiquement à L - 1 degrés de liberté.

Donc si la valeur calculée statistiques X 2 (la somme des « distances » entre les fréquences) sera supérieure à une certaine valeur limite, nous aurons alors des raisons de rejeter hypothèse nulle. Identique à vérifier hypothèses paramétriques, la valeur limite est réglée via niveau de signification. Si la probabilité que la statistique X2 prenne une valeur inférieure ou égale à celle calculée ( p-signification), sera moindre niveau de signification, Que hypothèse nulle peut être rejeté.

Dans notre cas, la valeur statistique est de 22,757. La probabilité que la statistique X2 prenne une valeur supérieure ou égale à 22,757 est très faible (0,000045) et peut être calculée à l'aide des formules
=CHI2.DIST.PH(22.757,4-1) ou
=CHI2.TEST(Observé ; Attendu)

Note: La fonction CHI2.TEST() est spécifiquement conçue pour tester la relation entre deux variables catégorielles (voir).

La probabilité 0,000045 est nettement inférieure à la normale niveau de signification 0,05. Ainsi, le joueur a toutes les raisons de soupçonner son adversaire de malhonnêteté ( hypothèse nulle son honnêteté est niée).

Lors de l'utilisation critère X 2 il faut s'assurer que le volume échantillons n était suffisamment grand, sinon l'approximation de la distribution ne serait pas valide statistiques X 2. On pense généralement que pour cela, il suffit que les fréquences observées (Observées) soient supérieures à 5. Si ce n'est pas le cas, alors les petites fréquences sont combinées en une ou ajoutées à d'autres fréquences, et la valeur combinée se voit attribuer un total probabilité et, par conséquent, le nombre de degrés de liberté est réduit X2 distributions.

Afin d'améliorer la qualité de l'application critère X 2(), il faut réduire les intervalles de partition (augmenter L et, par conséquent, augmenter le nombre degrés de liberté), cependant, cela est empêché par la limitation du nombre d'observations incluses dans chaque intervalle (db>5).

Cas continu

Test d'adéquation de Pearson X2 peut également être appliqué en cas de .

Considérons un certain échantillon, composé de 200 valeurs. Hypothèse nulle stipule que échantillon fait à partir de .

Note: Variables aléatoires dans exemple de fichier sur la feuille continue généré à l'aide de la formule =NORM.ST.INV(RAND()). Donc de nouvelles valeurs échantillons sont générés à chaque recalcul de la feuille.

La pertinence de l’ensemble de données existant peut être évaluée visuellement.

Comme le montre le diagramme, les valeurs de l'échantillon s'adaptent assez bien le long de la ligne droite. Cependant, comme pour tests d'hypothèses en vigueur Test d'ajustement du Pearson X 2.

Pour ce faire, nous divisons la plage de changement de la variable aléatoire en intervalles avec un pas de 0,5. Calculons les fréquences observées et théoriques. Nous calculons les fréquences observées à l'aide de la fonction FREQUENCY(), et les fréquences théoriques à l'aide de la fonction NORM.ST.DIST().

Note: Idem que pour cas discret, il faut s'assurer que échantillonétait assez grand et l'intervalle comprenait> 5 valeurs.

Calculons la statistique X2 et comparons-la avec la valeur critique pour un niveau de signification(0,05). Parce que nous avons divisé la plage de changement d'une variable aléatoire en 10 intervalles, puis le nombre de degrés de liberté est de 9. La valeur critique peut être calculée à l'aide de la formule
=CHI2.OBR.PH(0,05;9) ou
=CHI2.OBR(1-0,05;9)

Le graphique ci-dessus montre que la valeur statistique est de 8,19, ce qui est nettement plus élevé. valeur critiquehypothèse nulle n'est pas rejeté.

Ci-dessous, où échantillon a pris une signification improbable et basée sur critères Consentement de Pearson X 2 l'hypothèse nulle a été rejetée (même si les valeurs aléatoires ont été générées à l'aide de la formule =NORM.ST.INV(RAND()), fournissant échantillon depuis distribution normale standard).

Hypothèse nulle rejeté, bien que visuellement les données soient situées assez près d'une ligne droite.

Prenons également comme exemple échantillon de U(-3; 3). Dans ce cas, même à partir du graphique, il est évident que hypothèse nulle devrait être rejeté.

Critère Consentement de Pearson X 2 confirme également que hypothèse nulle devrait être rejeté.

Si la valeur obtenue du critère χ 2 est supérieure à la valeur critique, nous concluons qu'il existe une relation statistique entre le facteur de risque étudié et le résultat au niveau de signification approprié.

Exemple de calcul du test du Chi carré de Pearson

Déterminons la signification statistique de l'influence du facteur tabagisme sur l'incidence de l'hypertension artérielle à l'aide du tableau discuté ci-dessus :

1. Calculez les valeurs attendues pour chaque cellule :

2. Trouvez la valeur du test du chi carré de Pearson :

χ 2 = (40-33,6) 2 /33,6 + (30-36,4) 2 /36,4 + (32-38,4) 2 /38,4 + (48-41,6) 2 /41,6 = 4,396.

3. Nombre de degrés de liberté f = (2-1)*(2-1) = 1. À l'aide du tableau, nous trouvons la valeur critique du test du chi carré de Pearson, qui au niveau de signification p=0,05 et le le nombre de degrés de liberté 1 est 3,841.

4. Nous comparons la valeur obtenue du test du chi carré avec la valeur critique : 4,396 > 3,841, par conséquent, la dépendance de l'incidence de l'hypertension artérielle sur la présence de tabagisme est statistiquement significative. Le niveau de signification de cette relation correspond à p<0.05.

De plus, le test du Chi carré de Pearson est calculé à l'aide de la formule

Mais pour un tableau 2x2, des résultats plus précis sont obtenus par le critère de correction de Yates

Si Que N(0) accepté,

Quand accepté H(1)

Lorsque le nombre d'observations est faible et que les cellules du tableau contiennent une fréquence inférieure à 5, le test du chi carré n'est pas applicable et est utilisé pour tester des hypothèses. Test exact de Fisher . La procédure de calcul de ce critère demande beaucoup de travail et, dans ce cas, il est préférable d'utiliser des programmes informatiques d'analyse statistique.

À l'aide du tableau de contingence, vous pouvez calculer la mesure du lien entre deux caractéristiques qualitatives - c'est le coefficient d'association de Noël Q (analogue au coefficient de corrélation)

Q est compris entre 0 et 1. Un coefficient proche de un indique un lien fort entre les caractéristiques. S'il est égal à zéro, il n'y a pas de connexion .

Le coefficient phi carré (φ 2) est utilisé de la même manière

TÂCHE DE RÉFÉRENCE

Le tableau décrit la relation entre la fréquence de mutation dans les groupes de drosophiles avec et sans alimentation.



Analyse du tableau de contingence

Pour analyser le tableau de contingence, une hypothèse H 0 est avancée, c'est-à-dire l'absence d'influence de la caractéristique étudiée sur le résultat de l'étude. Pour cela, la fréquence attendue est calculée et un tableau d'espérance est construit.

Table d'attente

groupes Cultures Chilo Total
A donné des mutations N'a pas donné de mutations
Fréquence réelle Fréquence attendue Fréquence réelle Fréquence attendue
Avec alimentation
Sans alimentation
Total

Méthode n°1

Déterminez la fréquence d’attente :

2756-X ;

2. 3561 – 3124

Si le nombre d'observations dans les groupes est faible, lors de l'utilisation de X 2, dans le cas de la comparaison des fréquences réelles et attendues avec des distributions discrètes, une certaine inexactitude est associée. Pour réduire l'inexactitude, la correction de Yates est utilisée.

Considérez la distribution du chi carré. Utilisation de la fonction MS EXCELCH2.DIST() Traçons la fonction de distribution et la densité de probabilité, et expliquons l'utilisation de cette distribution à des fins de statistiques mathématiques.

Distribution du chi carré (X2, XI2, AnglaisChi- au carrédistribution) utilisé dans diverses méthodes de statistiques mathématiques :

  • lors de la construction;
  • à ;
  • à (les données empiriques sont-elles d'accord ou non avec notre hypothèse sur la fonction de distribution théorique, anglais Goodness-of-fit)
  • at (utilisé pour déterminer la relation entre deux variables catégorielles, test d'association du chi carré anglais).

Définition: Si x 1 , x 2 , …, x n sont des variables aléatoires indépendantes distribuées sur N(0;1), alors la distribution de la variable aléatoire Y=x 1 2 + x 2 2 +…+ x n 2 a distribution X2 avec n degrés de liberté.

Distribution X2 dépend d'un paramètre appelé degré de liberté (df, degrésdeliberté). Par exemple, lors de la construction nombre de degrés de liberté est égal à df=n-1, où n est la taille échantillons.

Densité de distribution X2 exprimé par la formule :

Graphiques de fonctions

Distribution X2 a une forme asymétrique, égale à n, égale à 2n.

DANS exemple de fichier sur la feuille graphique donné graphiques de densité de distribution probabilités et fonction de distribution cumulative.

Propriété utile Répartition CH2

Soient x 1 , x 2 , …, x n des variables aléatoires indépendantes réparties sur loi normale avec les mêmes paramètres μ et σ, et Xav est moyenne arithmétique ces valeurs x.
Alors la variable aléatoire ouiégal

Il a X2 -distribution avec n-1 degrés de liberté. En utilisant la définition, l'expression ci-dessus peut être réécrite comme suit :

Ainsi, distribution d'échantillonnage statistiques y, à échantillon depuis distribution normale, Il a X2 -distribution avec n-1 degrés de liberté.

Nous aurons besoin de cette propriété quand . Parce que dispersion ne peut être qu'un nombre positif, et X2 -distribution est utilisé pour l’évaluer, alors oui d.b. >0, comme indiqué dans la définition.

Répartition du CH2 dans MS EXCEL

Dans MS EXCEL, à partir de la version 2010, pour X2 -distributions il existe une fonction spéciale CHISQ.DIST(), qui vous permet de calculer densité de probabilité(voir formule ci-dessus) et (la probabilité qu'une variable aléatoire X ait CI2-distribution, prendra une valeur inférieure ou égale à x, P(X<= x}).

Note: Parce que Répartition du CH2 est un cas particulier, alors la formule =DIST.GAMMA(x;n/2;2;VRAI) pour un entier positif n renvoie le même résultat que la formule =CHI2.DIST(x;n; VRAI) ou =1-CHI2.DIST.PH(x;n) . Et la formule =DIST.GAMMA(x;n/2;2;FALSE) renvoie le même résultat que la formule =CHI2.DIST(x;n; FAUX), c'est à dire. densité de probabilité Répartition CH2.

La fonction HI2.DIST.PH() renvoie fonction de distribution, plus précisément, la probabilité du côté droit, c'est-à-dire P(X > X). Il est évident que l'égalité est vraie
=CHI2.DIST.PH(x;n)+CHI2.DIST(x;n;TRUE)=1
parce que le premier terme calcule la probabilité P(X > x), et le second P(X<= x}.

Avant MS EXCEL 2010, EXCEL n'avait que la fonction CHIDIST(), qui permet de calculer la probabilité du côté droit, c'est-à-dire P(X > X). Les capacités des nouvelles fonctions MS EXCEL 2010 XI2.DIST() et XI2.DIST.PH() couvrent les capacités de cette fonction. La fonction CH2DIST() est laissée dans MS EXCEL 2010 pour des raisons de compatibilité.

CHI2.DIST() est la seule fonction qui renvoie densité de probabilité de la distribution du chi2(le troisième argument doit être FAUX). Le reste des fonctions renvoie fonction de distribution cumulative, c'est à dire. probabilité que la variable aléatoire prenne une valeur dans la plage spécifiée : P(X<= x}.

Les fonctions MS EXCEL ci-dessus sont données dans .

Exemples

Trouvons la probabilité que la variable aléatoire X prenne une valeur inférieure ou égale à celle donnée X:P(X<= x}. Это можно сделать несколькими функциями:

CHI2.DIST(x; n; VRAI)
=1-HI2.DIST.PH(x; n)
=1-CHI2DIST(x; n)

La fonction CH2.DIST.PH() renvoie la probabilité P(X > x), dite probabilité de droite, afin de trouver P(X<= x}, необходимо вычесть ее результат от 1.

Trouvons la probabilité que la variable aléatoire X prenne une valeur supérieure à une valeur donnée X: P(X > X). Cela peut être fait avec plusieurs fonctions :

1-CHI2.DIST(x; n; VRAI)
=HI2.DIST.PH(x; n)
=CHI2DIST(x; n)

Fonction de distribution inverse du chi2

La fonction inverse est utilisée pour calculer alpha- , c'est à dire. calculer des valeurs X pour une probabilité donnée alpha, et X doit satisfaire l'expression P(X<= x}=alpha.

La fonction CH2.INV() permet de calculer intervalles de confiance de la variance de la distribution normale.

La fonction CHI2.OBR.PH() est utilisée pour calculer, c'est-à-dire si un niveau de signification est spécifié comme argument de la fonction, par exemple 0,05, alors la fonction renverra une valeur de la variable aléatoire x pour laquelle P(X>x)=0,05. A titre de comparaison : la fonction XI2.INR() renverra une valeur de la variable aléatoire x pour laquelle P(X<=x}=0,05.

Dans MS EXCEL 2007 et versions antérieures, au lieu de HI2.OBR.PH(), la fonction HI2OBR() était utilisée.

Les fonctions ci-dessus peuvent être interchangées, car les formules suivantes renvoient le même résultat :
=CHI.OBR(alpha;n)
=HI2.OBR.PH(1-alpha;n)
=CHI2INV(1-alpha;n)

Quelques exemples de calculs sont donnés dans exemple de fichier sur la feuille Fonctions.

Fonctions MS EXCEL utilisant la distribution CH2

Vous trouverez ci-dessous la correspondance entre les noms de fonctions russes et anglais :
CH2.DIST.PH() - Anglais. nom CHISQ.DIST.RT, c'est-à-dire CHI-Squared DISTribution Right Tail, la distribution du Chi carré (d) à queue droite
CH2.OBR() - Anglais. nom CHISQ.INV, c'est-à-dire Distribution CHI carré INVerse
CH2.PH.OBR() - Anglais. nom CHISQ.INV.RT, c'est-à-dire Distribution CHI-carré INVerse Queue Droite
CH2DIST() - Anglais. nom CHIDIST, fonction équivalente à CHISQ.DIST.RT
CH2OBR() - Anglais. nom CHIINV, c'est-à-dire Distribution CHI carré INVerse

Estimation des paramètres de distribution

Parce que généralement Répartition du CH2 utilisé à des fins de statistiques mathématiques (calcul intervalles de confiance, tester des hypothèses, etc.), et presque jamais pour construire des modèles de valeurs réelles, alors pour cette distribution, la discussion sur l'estimation des paramètres de distribution n'est pas effectuée ici.

Approximation de la distribution CI2 par la distribution normale

Avec le nombre de degrés de liberté n>30 distribution X2 bien approché distribution normale avec valeur moyenneμ = n et variance σ=2*n (voir exemple de fichier de feuille).