Les principales étapes
Utilisation des centres de gravité
Exemple
Les principales étapes

Cette technique de classification a pour but de fournir une partition en k classes (k donné à priori) bien agrégées et bien séparées entre elles.
Déroulement de l'algorithme
Ayant un ensemble d'observations (ou objets), on part d'un choix de k (ici 2) noyaux estimé ou tirés au hasard pris parmi une famille de noyaux appelé espace de représentation L:

Chaque point de la population est ensuite affecté au noyau dont il est le plus proche. On a une partition en k classes dont on calcule les noyaux.
On recommence le procédé avec les nouveaux noyaux. On associe alors chaque point au noyau le plus proche:

Cet algorithme fait généralement décroître un critère W qui mesure l'adéquation entre les classes et leur noyau respectif. On peut formellement représenter ce critère par:
W:Lk * Pk ® R+

avec :
Lk = Wk l'ensemble des k-uples L =(L1, ...,Lk) avec Li ÎW.
Pk est l'ensemble des partitions P=(P1,..., Pk) à k classes de W.
avec D une mesure d'adéquation du noyau Li à la classe Pi (une petite valeur de D exprime une bonne adéquation entre Li et Pi).
A chaque itération de l'algorithme, la décroissance du critère exprime une augmentation globale de l'adéquation entre les classes et leurs noyaux.
L'algorithme s'arrête soit lorsque deux itérations successives conduisent à la même partition, soit lorsqu'un critère convenablement choisi (par exemple la variance intra-classe) cesse de décroître de façon sensible, soit encore parcequ'un nombre maximal d'itération a été fixé à priori. Dans tous les cas, la partition obtenue dépendra du choix initial des centres(noyaux) à l'étape 0.