![]() |
![]() |
![]() |
![]() |
![]() |
| Introduction |
| Individus et variables |
| Construction d'un tableau de données |
| Description élémentaire d'un tableau |
| Changement de variables et codage |
| Similarité |
|
II Construction d'un tableau de données 2.1 Définition Un tableau de données se déduit de la définition de l'ensemble des individus et des variables. Soit n le nombre d'individus, un individu sera noté wi et correspond à une ligne du tableau. Soit p le nombre de variables, une variable sera noté vj et correspond à une colonne. Nous notons W l'ensemble des individus { w1, …, wn}; V est l'ensemble des variables { v1, …,vp}. Le tableau de données associé est X= (xij ; i=1..n ; j=1..p ) où xij = vj(wi)
2.2 Exemples de tableaux de données 2.2.1 Tableau individus*variables 1) Tableau de données quantitatives: c'est le cas où toutes les variables sont quantitatives. Exemple :W est un ensemble dont chaque élément wi est associé à un sondage géologique. Les paramètres expriment la teneur en différents minerais de chacun des sondages. vj(wi)est une mesure de la teneur du minerai pour le sondage wi.
2) Tableau de données qualitatives ou de modalités : c'est le cas où toutes les variables sont qualitatives. Si toutes les variables sont ordinales (resp nominales) on dira que l'on a un tableau de modalités ordonnées (resp non ordonnées)
1 ® pas du tout ; 2 ® quelques fois ; 3 ® souvent. 3) Tableau binaire : on rencontre souvent des variables qui ne prennent que deux valeurs codées généralement 0 et 1. Elles conduisent à des tableaux binaires.
4) Tableau de préférence : on peut par exemple disposer des préférences des personnes interrogées sur des marques de parfum
Ainsi V3(w2) =5; signifie que le deuxième individu préfère la troisième marque de parfum à toutes les autres. 5) Tableau hétérogène : c'est le cas de tableau où les variables sont de types différents:
2.2.2 Tableaux variables*variables Tableau de contingence et tableaux de fréquence A partir de deux variables qualitatives on définit le tableau de contingence croisant les modalités de deux variables. La case à l'intersection de la ligne i et de la colonne j contient le nombre d'individus ayant choisi la modalité i de la première variable et la modalité j de la seconde variable. Si l'on divise chaque valeur de ce tableau par le cardinal de la population, on obtient le tableau de fréquences relatives que l'on appellera plus simplement tableau de fréquence.
avec s représentant le cardinal de la population sur laquelle sont définies les deux
variables qualitatives. Le tableau F des fréquences est l'ensemble
est une estimation de la probabilité qu'un individus présente simultanément la modalité
i et la modalité j. On définit aussi les fréquences marginales
![]() Les vecteurs (f1.,… fi.,.. fn.) et (f.1, … f.j, .. f.p) sont notés fI et fJ . Ce sont les lois marginales définies sur I et J. On définit les fréquences conditionnelles ![]() Les vecteurs sont notés
.Ce sont les lois conditionnelles. Elles sont aussi appelées profils. Toutes les quantités
sont positives et inférieures à un, en plus on a : ![]() ![]() 2.2.3 Tableau de contingence multiple Un tableau de contingence multiple est construit à partir de deux variables qualitatives définies sur une même population. Ceci peut être généralisé en croisant non plus deux variables qualitatives mais deux familles de variables qualitatives définies sur une même population. On parle alors de tableau de contingence multiple. Si on note (I1,..,Ir) et (J1, ..,Jr) les deux familles de variables qualitatives, le tableau de contingence multiple associé est formé des tableaux de contingence Tkl de tous les couples (Ik,Jl) avec 1 £ k £r et 1 £l £t.
Les deux familles ne sont pas nécessairement disjointes. Si les deux familles de variables sont identiques le tableau obtenu est appelé tableau de Burt. Lorsqu'une des familles est réduite à une seule variable, la tableau obtenu est appelé tableau de contingence juxtaposé. 2.2.4 Tableau de similarité Ces tableaux recensent des similarités entre des variables. On considère souvent les tableaux de corrélation et de covariance définis par les corrélations ou les covariances de tous les couples de variables quantitatives comme tableaux de similarité. 2.2.5 Tableaux individus*individus Lorsqu'on évalue la similarité ou la dissimilarité entre chaque couple d'individus, on construit un tableau de proximité. Par exemple si l'on considère des machines à laver que l'on veut comparer les unes aux autres, la case (i,j) contient une note de 1 à 10 mesurant la ressemblance des machines j et k.
Exercice |