Google a ouvert l'API pour OCR
Services Web / / December 24, 2019
Oui, ils travaillent dans les Google Livres apportent certainement de bons résultats, nous pouvons commencer à récolter. Et maintenant, je vais vous dire comment.
Ces documents ne sont pas toujours besoin d'une transformation dans le texte actuel. Mais parfois, elle veut de ne pas gagner à nouveau un accord, et une copie électronique de quelque chose et non. Bien sûr, vous pouvez utiliser un programme pas cher l'OCR, aller avec le scanner, ou même acheter (pas vous voler) FineReader. Mais le logiciel de bureau libre OCR fonctionne aussi parce que maintenant les textes sont de plus en plus photographiées, pas numérisé.
Pour télécharger des photos (jpeg, png, gif) avec la reconnaissance de texte pour API Google ultérieure et ouverte dans Google Docs. Maintenant, vous pouvez télécharger des images à une bibliothèque de documents, et le serveur Google se transformer en texte.
Il y a aussi un exemple d'application qui illustre comment l'API:
Mais vous, les programmeurs devraient penser à créer leur propre interface à ces capacités. Par exemple - avez-vous les scans de livres en PNG? Ceci est une perversion, est-ce pas? Donc là vous avez la carte en main - écrire une application qui charge la page de texte par page, ne viole pas les limites et relie la totalité de la charge dans un seul texte.
Mais rappelez-vous, il y a des limites de l'API, et le principal d'entre eux, il me semble - quelque chose qui est reconnu que le latin dès qu'elle. Aussi il faut veiller à la hauteur des caractères est pas moins de 10 pixels, et la taille totale de l'image ne dépasse pas 10 millions de pixels.