A Strategy for Selecting Classes of Symbols from Classes of Graphemes in HMM-Based Handwritten Word Recognition

A Strategy for Selecting Classes of Symbols from Classes of Graphemes in HMM-Based Handwritten Word Recognition

Freitas, Cinthia O. A. and Bortolozzi, Flávio and Sabourin, Robert

Revista Eletrônica de Sistemas de Informação 2004

Abstract : Este artigo descreve uma metodologia para seleção de classes de símbolos a partir de classesde grafemas em um sistema de reconhecimento de palavras manuscritas do extenso de cheques bancáriosbrasileiros baseado em HMM (Hidden Markov Models). Este artigo discute as definições de primitivas,grafemas e s\ḿbolos considerando um enfoque Global para o reconhecimento das palavras, o qual evita asegmentação das palavras em letras ou pseudo-letras utilizando HMM. Assim, a entrada para os modelosconsiste em uma descrição da palavra a partir de um alfabeto de s\’b́olos gerados a partir dos grafemasextra\’iś das imagens das palavras, sendo esta a representação vis\’iv ́para o HMM. Portanto, a idéia éintroduzir uma conceituação de alto n\’ive ́tais como primitivas perceptivas (laços, ascendentes,descendentes, concavidades e convexidades) e fornecer um modo de retro-alimentação rápido e informativosobre a informação contida em cada classe de grafema, permitindo uma seleção de classes de s\’imboś. Oartigo apresenta o algoritmo com base na Informação Mútua (Mutual Information) e HMM, ambostrabalhando em um mesmo processo de avaliação. Os resultados experimentais demonstram que é poss\’ivelsécionar a partir de um conjunto “original” de grafemas (composto por 94 grafemas) um alfabeto des\’imbolo(́composto por 29 s\’imbolos ́O artigo conclui que o poder discriminante dos grafemas é muitoimportante para a consolidação de um alfabeto de s\’imbolos.