Dans le cadre de la reconnaissance automatique de types de formulaires avec champs manuscrits et sans aucun signe de référence, basée sur une description de la structure physique du formulaire, nous sommes amenés à représenter un formulaire par un modèle de Markov caché pseudo-2D (PHMM). Ce modèle est constitué d'un graphe de super-états. A chaque super-état on associe un modèle de Markov caché secondaire (HMM) dont les observations sont continues. Nous exposons pourquoi la méthode classique des k-moyennes est mal adaptée à notre problème, puis nous détaillons une nouvelle méthode générale qui prend mieux en compte la réalité physique des états, en les situant dans l'espace de représentation des caractéristiques, et en les construisant dynamiquement par agrégation progressive des séquences d'observations. Ce n'est qu'à la fin du processus d'agrégation que le nombre d'états du modèle stochastique initial est connu.