Le Blog de Myriad -



Myriad Blog 1.3.0	Thursday, Apr 18^th, 2024 at 11:16am

The Myriad team shares here its everyday life and its mood

Thursday, Dec 4^th, 2008 at 05:11pm

ScanToMusic Etape 30

Nous avons maintenant passé en revue la plupart des algorithmes de reconnaissance de caractères. Nous commençons à avoir une vision claire de ce qui peut fonctionner et des problèmes inhérents à chaque méthode.

Un bon taux de reconnaissance pourrait être effectué en écrivant un sous-programme spécifique pour chaque caractère, du genre : "s'il y a un demi-cercle en bas à gauche, et une grande ligne verticale à droite, c'est un 'd' ". Mais nous préférerions éviter ce genre de chose, car cela empêche une amélioration de l'algorithme par apprentissage. Pour que le résultat change, il faut modifier le programme...

Une autre méthode, l'une des plus anciennes, qui donne étonnamment de bons résultats, est la comparaison graphique des matrices de points. Mais cette méthode reconnaît mal les fontes ou les styles encore jamais rencontrés.

L'extraction de données caractéristiques du caractères (position des trous et des bosses, courbes, lignes, etc) permet d'atteindre d'assez bons taux avec seulement une poignée de données décrivant le caractère.

Nous essayons donc d'implémenter une méthode "mixte", combinant l'extraction de données caractéristiques et une reconnaissance de la matrice de points. Sachant que les deux méthodes, indépendamment, trouvent toujours le bon résultat dans les 5 premiers, la combinaison des deux devrait donc augmenter sensiblement le taux de reconnaissance.
La manière de combiner les deux n'a, d'après la documentation que nous avons pu trouver, jamais été mise en oeuvre jusqu'ici. Est-ce parce que cela ne fonctionne pas, ou parce que personne n'y a pensé avant ? Les tests de ces prochains jours nous permettront de le savoir.

by Olivier Guillion

Comments

Comment from bubu42

Thursday, Dec 4^th, 2008 at 10:24pm

méthodes combinées

La manière de combiner les deux n'a, d'après la documentation que nous avons pu trouver, jamais été mise en oeuvre jusqu'ici. Est-ce parce que cela ne fonctionne pas, ou parce que personne n'y a pensé avant ? Les tests de ces prochains jours nous permettront de le savoir.
C'est peut-être aussi parce que du point de vue calcul, ça alourdit considérablement le programme. Avec les machines rapides d'aujourd'hui, le problème est minimisé, mais il y a quelques années, les processeurs n'étaient pas aussi performants.

Comment from Pascal

Friday, Dec 5^th, 2008 at 03:54pm

-bruit-

Je parcours de temps en temps le blog et l'évolution de ScanToMusic, dont je ne peut qu'admirer le nouvel exploit en marche.

Une question fatidique s'impose :
Auriez-vous trouvé une solution pour vous débarrasser des "mauvais caractères" ?

Pascal P.

Sorting

Most recent first
Oldest first

Top of page

Legal information

Last update: