HomeProductsDownloadOrderSupportSearch
  
 
 Myriad Blog 1.3.0 Tuesday, Mar 19th, 2024 at 06:21am 

Dev News Thursday, Dec 4th, 2008 at 05:11pm
ScanToMusic Etape 30

 
Nous avons maintenant passé en revue la plupart des algorithmes de reconnaissance de caractères. Nous commençons à avoir une vision claire de ce qui peut fonctionner et des problèmes inhérents à chaque méthode.
 
Un bon taux de reconnaissance pourrait être effectué en écrivant un sous-programme spécifique pour chaque caractère, du genre : "s'il y a un demi-cercle en bas à gauche, et une grande ligne verticale à droite, c'est un 'd' ". Mais nous préférerions éviter ce genre de chose, car cela empêche une amélioration de l'algorithme par apprentissage. Pour que le résultat change, il faut modifier le programme...
 
Une autre méthode, l'une des plus anciennes, qui donne étonnamment de bons résultats, est la comparaison graphique des matrices de points. Mais cette méthode reconnaît mal les fontes ou les styles encore jamais rencontrés.
 
L'extraction de données caractéristiques du caractères (position des trous et des bosses, courbes, lignes, etc) permet d'atteindre d'assez bons taux avec seulement une poignée de données décrivant le caractère.  
 
Nous essayons donc d'implémenter une méthode "mixte", combinant l'extraction de données caractéristiques et une reconnaissance de la matrice de points. Sachant que les deux méthodes, indépendamment, trouvent toujours le bon résultat dans les 5 premiers, la combinaison des deux devrait donc augmenter sensiblement le taux de reconnaissance.
La manière de combiner les deux n'a, d'après la documentation que nous avons pu trouver, jamais été mise en oeuvre jusqu'ici. Est-ce parce que cela ne fonctionne pas, ou parce que personne n'y a pensé avant ? Les tests de ces prochains jours nous permettront de le savoir.
by Olivier Guillion
 2 comments.

Dev News Wednesday, Dec 10th, 2008 at 05:54pm
ScanToMusic Etape 32

 
Souvent, les scans des pages sont effectués avec une faible précision, ce qui peut poser problème au module de reconnaissance.  
Avec peu de pixels, les caractères sont crénelés, présentant des arêtes aiguës, et certaines opérations graphiques (extraction de squelette ou de contour par exemple) peuvent être perturbées.
 
Aussi désirons-nous, lorsque le nombre de pixels est insuffisant, "zoomer" le caractère afin de reconstituer les courbes et les formes qui les composent. Evidemment, il ne s'agit pas simplement d'agrandir les pixels, cela ne supprimerait pas le crénelage.
 
Deux solutions sont utilisables.  
 
La première, la plus simple, consiste à agrandir les pixels du caractère puis d'appliquer un effet de flou assez puissant. Les contours du caractère deviennent alors indéfinis. En jouant alors sur l'histogramme des valeurs de gris, on peut lui redonner une certaine netteté. Les courbes sont ainsi arrondies.
 
La seconde est d'utiliser un redimensionnement "bicubique". Il s'agit de considérer que chaque position intermédiaire entre les pixels suit une fonction mathématique (polynôme d'ordre 3) dépendante des pixels adjacents.  La valeur des pixels intermédiaires passe donc d'une valeur de pixel à l'autre en suivant une courbe douce (spline).
 
Les deux méthodes donnent des résultats assez proches.  
Par exemple, ici, à gauche le caractère brut, dont les pixels ont été simplement agrandis,. au milieu, le résultat de l'agrandissement par flou/histogramme, et à droite le résultat de l'agrandissement bicubique :
 

 
La méthode du milieu donne des formes plus rondes, mais au détriment des détails (base et jonction de la barre verticale du "P", haut de la barre du "d", etc) et a tendance à éroder les lignes fines, comme le haut du "e".
 
Nous avons donc conservé l'agrandissement bicubique (à droite). Il sera appliqué dès que le caractère à reconnaître est d'une taille inférieure à un seuil à déterminer.
by Olivier Guillion

Dev News Thursday, Dec 18th, 2008 at 04:36pm
ScanToMusic étape 34

 
Ca y est, un module de reconnaissance optique des caractères alphanumériques est maintenant opérationnel.
 
Lorsque les caractères individuels ont été correctement extraits du texte, et que le programme d'extraction peut  fournir quelques informations sur l'échelle des caractères et leur position par rapport à la ligne de base, ce module a un taux de succès qui avoisine les 100%.
 
Les erreurs qu'il commet encore surviennent sur des scans de mauvaise qualité, ou lorsque plusieurs lettres collées sont considérées comme une seule.
 
Il nous faut maintenant interconnecter nos différents modules, pour réaliser une chaine complète allant de l'image scannée au texte complet extrait.
 
Seul bémol pour l'instant, la reconnaissance, si elle fonctionne assez bien, reste abominablement lente. Du travail d'optimisation devra être effectué pour rendre le procédé utilisable, mais ce n'est pas notre souci pour l'instant. D'abord quelque chose qui fonctionne tout court, et ensuite seulement quelque chose qui fonctionne vite.
by Olivier Guillion
 2 comments.

Dev News Monday, Dec 22nd, 2008 at 05:02pm
ScanToMusic étape 35

 
Le module d'extraction de zones de caractères dans une image et le module de reconnaissance ont été fusionnés.
 
On peut donc maintenant charger une page scannée, lancer une analyse, et obtenir graphiquement le texte reconnu affiché en surimpression sur le scan.
 
Cela va nous permettre de poursuivre plus avant l'amélioration de la reconnaissance, mais nous devrons rapidement résoudre le problème de lenteur de calcul, qui va nous gêner dans nos mises au point.
 
Avant d'optimiser les routines de reconnaissances elles-mêmes, nous essayons de trouver un algorithme simple et rapide, fiable à 100%, permettant d'éliminer des comparaisons les caractères trop différents du caractère scanné. En effet, plutôt que de rendre plus rapide la fonction complexe de comparaison, il vaudrait mieux qu'elle soit exécutée le moins souvent possible.  
 
Et rien ne nous empêchera, une fois cela fait, de l'optimiser quand même...
by Olivier Guillion

Dev News Monday, Dec 29th, 2008 at 05:09pm
ScanToMusic étape 36

 
Maintenant que le module de reconnaissance de caractères est suffisamment avancé, nous allons poursuivre deux tâches en parallèle :  
 
- L'amélioration de la reconnaissance de textes, notamment par un meilleur découpage des zones de texte en caractères individuels
 
- L'application des connaissances que nous avons pu acquérir à la reconnaissance des symboles musicaux proprement dite. Le problème principal réside dans les lignes des portées, qui "brouillent" la reconnaissance.
Deux solutions sont possibles:
 
Soit nous essayons d'enlever physiquement ces lignes de l'image, en tentant de reconstituer les parties des symboles qui sont dessinées dessous
 
Soit  nous adaptons nos algorithmes de reconnaissance, en leur faisant ignorer partiellement ou totalement ces parties-là.
 
Entre les deux, notre coeur balance...
by Olivier Guillion


Full view
Reduced view
Most recent first
Oldest first
All
Didier Guillion
Olivier Guillion
Sylvie Ricard
All
To be seen
Mood
Dev News
Myriad Life
Memories
Technical
30 previous days
Apr 2006
May 2006
Jun 2006
Jul 2006
Aug 2006
Sep 2006
Oct 2006
Nov 2006
Dec 2006
Jan 2007
Feb 2007
Mar 2007
Apr 2007
May 2007
Jun 2007
Jul 2007
Aug 2007
Sep 2007
Oct 2007
Nov 2007
Dec 2007
Jan 2008
Feb 2008
Mar 2008
Apr 2008
May 2008
Jun 2008
Jul 2008
Aug 2008
Sep 2008
Oct 2008
Nov 2008
Dec 2008
Jan 2009
Feb 2009
Mar 2009
Apr 2009
May 2009
Jun 2009
Jul 2009
Aug 2009
Sep 2009
Oct 2009
Nov 2009
Dec 2009
Jan 2010
Feb 2010
Mar 2010
Apr 2010
May 2010
Jun 2010
Jul 2010
Aug 2010
Sep 2010
Oct 2010
Nov 2010
Dec 2010
Jan 2011
Feb 2011
Mar 2011
Apr 2011
May 2011
Jun 2011
Jul 2011
Aug 2011
Sep 2011
Oct 2011
Nov 2011
Dec 2011
Jan 2012
Feb 2012
Mar 2012
Apr 2012
May 2012
Jun 2012
Jul 2012
Aug 2012
Sep 2012
Oct 2012
Nov 2012
Dec 2012
Jan 2013
Feb 2013
Mar 2013
Apr 2013
May 2013
Jun 2013
Jul 2013
Aug 2013
Sep 2013
Oct 2013
Nov 2013
Dec 2013
Jan 2014
Feb 2014
Mar 2014
Apr 2014
May 2014
Jun 2014
Jul 2014
Aug 2014
Sep 2014
Oct 2014
Nov 2014
Dec 2014
Jan 2015
Feb 2015
Mar 2015
Apr 2015
May 2015
Jun 2015
Jul 2015
Aug 2015
Sep 2015
Oct 2015
Nov 2015
Dec 2015
Jan 2016
Feb 2016
Mar 2016
Apr 2016
May 2016
Jun 2016
Jul 2016
Aug 2016
Sep 2016
Oct 2016
Nov 2016
Dec 2016
Jan 2017
Feb 2017
Mar 2017
Apr 2017
May 2017
Jun 2017
Jul 2017
Aug 2017
Sep 2017
Oct 2017
Nov 2017
Dec 2017
Jan 2018
Feb 2018
Mar 2018
Apr 2018
May 2018
Jun 2018
Jul 2018
Aug 2018
Sep 2018
Oct 2018
Nov 2018
Dec 2018
Jan 2019
Feb 2019
Mar 2019
Apr 2019
May 2019
Jun 2019
Jul 2019
Aug 2019
Sep 2019
Oct 2019
Nov 2019
Dec 2019
Jan 2020
Feb 2020
Mar 2020
Apr 2020
May 2020
Jun 2020
Jul 2020
Aug 2020
Sep 2020
Oct 2020
Nov 2020
Dec 2020
Jan 2021
Feb 2021
Mar 2021
Apr 2021
May 2021
Jun 2021
Jul 2021
Aug 2021
Sep 2021
Oct 2021
Nov 2021
Dec 2021
Jan 2022
Feb 2022
Mar 2022
Apr 2022
May 2022
Jun 2022
Jul 2022
Aug 2022
Sep 2022
Oct 2022
Nov 2022
Dec 2022
Jan 2023
Feb 2023
Mar 2023
Apr 2023
May 2023
Jun 2023
Jul 2023
Aug 2023
Sep 2023
Oct 2023
Nov 2023
Dec 2023
Jan 2024
Feb 2024
Mar 2024
Mar 18th, 2024 at 08:14pm 
Comment from Sylvain
Mar 18th, 2024 at 08:13pm 
Comment from Sylvain
@André
Mar 18th, 2024 at 07:28pm 
Comment from Antoine Bautista
Build 82....
Mar 18th, 2024 at 05:02pm 
Article from Didier Guillion
Harmony Assistant 9.9.8  étape 198
Mar 18th, 2024 at 05:02pm 
Article from Didier Guillion
Harmony Assistant 9.9.8  étape 198
Mar 17th, 2024 at 11:40am 
Comment from Antoine Bautista
Frite....
Mar 17th, 2024 at 11:40am 
Comment from Antoine Bautista
Frite....
Mar 16th, 2024 at 09:16am 
Comment from André Baeck
Mar 16th, 2024 at 09:16am 
Comment from André Baeck
Mar 16th, 2024 at 09:13am 
Comment from André Baeck

Top of page
Legal information Cookies Last update:  (c) Myriad