Comment fonctionne la reconnaissance optique de caractères (OCR)
La reconnaissance optique de caractères (OCR) fait référence à un logiciel qui crée une version numérique d’un document imprimé, dactylographié ou manuscrit qu’un ordinateur peut lire sans taper ni saisir de texte manuellement. L’OCR est généralement utilisé sur des documents numérisés au format PDF, mais peut également créer une version texte lisible par ordinateur d’un fichier image.
Qu’est-ce que la ROC
L’OCR, également connue sous le nom de reconnaissance de texte, est une technologie logicielle qui convertit les caractères tels que les chiffres, les lettres et les signes de ponctuation (également appelés glyphes) des documents imprimés ou écrits en texte électronique qui est plus facilement reconnu et lu par les ordinateurs et autres logiciels. programmes.formulaire. Certains programmes OCR effectuent cette opération lorsque des documents sont numérisés ou photographiés avec un appareil photo numérique, tandis que d’autres programmes peuvent appliquer ce processus à des documents qui n’ont pas été précédemment numérisés ou photographiés avec OCR. L’OCR permet aux utilisateurs de rechercher, de modifier du texte et de reformater des documents dans des documents PDF.
Numérisez des journaux historiques à l’aide d’un logiciel OCR.
Getty Images
A quoi sert l’OCR ?
Pour les besoins de numérisation quotidiens rapides, l’OCR peut ne pas être un gros problème. Si vous numérisez beaucoup, la possibilité de rechercher dans les fichiers PDF pour trouver le fichier exact dont vous avez besoin peut vous faire gagner beaucoup de temps et rendre la fonction OCR de votre programme de numérisation encore plus importante. Voici une aide supplémentaire avec l’OCR :
- Traitement et saisie automatique des données (Exemple: un système de suivi des candidatures pour les CV).
- Rendre les livres numérisés consultables.
- Convertissez des numérisations manuscrites en texte lisible par ordinateur.
- Rendre la documentation plus accessible aux programmes de lecture qui aident les utilisateurs malvoyants.
- Enregistrez des documents historiques et des journaux tout en pouvant les rechercher.
- Extraction et transfert de données vers des programmes comptables (ex. : reçus et factures).
- Indexer les documents à utiliser par les moteurs de recherche.
- Reconnaissance de la plaque d’immatriculation du conducteur via le logiciel de radars et de caméras aux feux rouges.
- Un synthétiseur vocal pour les non-locuteurs – Le physicien théoricien Stephen Hawking est probablement l’utilisateur le plus célèbre d’un programme de synthèse vocale.
Pourquoi utiliser la ROC ?
Pourquoi ne pas simplement prendre des photos, n’est-ce pas ? Parce que vous ne pourrez rien modifier ni rechercher dans le texte puisqu’il ne s’agit que d’une image. La numérisation d’un document et l’exécution d’un logiciel OCR peuvent transformer ce fichier en un fichier modifiable et consultable.
Histoire de l’OCR
Alors que la première utilisation de la reconnaissance de texte remonte à 1914, le développement et l’utilisation généralisés des technologies liées à l’OCR ont vraiment commencé dans les années 1950, notamment avec la création de polices très simplifiées et plus faciles à convertir en texte lisible numériquement. La première de ces polices simplifiées a été créée par David Shepard et est communément appelée OCR-7B. L’OCR-7B est encore utilisé aujourd’hui dans le secteur financier comme police standard utilisée sur les cartes de crédit et de débit. Dans les années 1960, les services postaux de plusieurs pays, dont les États-Unis, le Royaume-Uni, le Canada et l’Allemagne, ont commencé à utiliser la technologie OCR pour accélérer considérablement le tri du courrier. L’OCR reste la technologie de base utilisée par les services postaux du monde entier pour trier le courrier. En 2000, des connaissances critiques sur les limites et les capacités de la technologie OCR ont été utilisées pour développer des programmes CAPTCHA pour contrecarrer les robots et les spammeurs.
Au fil des décennies, l’OCR est devenu de plus en plus précis et sophistiqué grâce aux avancées dans des domaines techniques connexes tels que l’intelligence artificielle, l’apprentissage automatique et la vision par ordinateur. Aujourd’hui, le logiciel OCR utilise la reconnaissance de formes, la détection de caractéristiques et l’exploration de texte pour convertir les documents plus rapidement et plus précisément que jamais.
FAQ
-
Comment numériser des documents avec mon téléphone ou ma tablette ?
Sur iOS, ouvrez l’application Notes et créez une nouvelle note.Allumez l’appareil photo, puis touchez numériser un documentSur Android, ouvrez Google Drive et sélectionnez ajouter (+), puis touchez balayage Numérisez des documents avec votre téléphone.
-
Comment utiliser l’OCR dans Adobe Acrobat ?
Ouvrez un fichier PDF contenant une image numérisée et sélectionnez outil > éditer le PDFAcrobat appliquera automatiquement l’OCR afin que vous puissiez modifier le texte. Sélectionnez simplement l’emplacement que vous souhaitez modifier et commencez à taper.
-
Quelle est la différence entre OCR et OMR ?
La reconnaissance optique de marques (OMR) est un logiciel qui détecte les marques sur du papier, généralement du papier bulle. OMR est utilisé pour traiter les résultats d’examens, d’enquêtes, de questionnaires et même d’élections. Contrairement à l’OCR, l’OMR ne peut pas déchiffrer le balisage sur la page, il ne peut que vérifier la présence du balisage.
Merci de nous en informer!
Recevez chaque jour les dernières actualités technologiques
abonnement
Dites-nous pourquoi !
D’autres ne sont pas assez détaillés pour comprendre