10.- El reconocimiento óptico de caracteres.

Caso práctico
Imagen de Isabel.

Juan Antonio lleva toda la tarde trabajando con buena productividad, pero necesita copiar varias páginas de los resultados de uno de sus compañeros que le ha dejado impresos. Recuerda que Isabel le ha explicado algo sobre digitalizar los documentos y de ese modo se ahorra tener que teclearlos, pero no sabe cómo hacerlo.

Después de escanear los informes se encuentra que tiene las imágenes de los mismos, pero no sabe qué hacer con ellas y no queda bien si corta y pega una parte de la imagen. Isabel le ha dicho que una vez digitalizados sólo tiene que seleccionar el texto que necesita incluir y pegarlo en su documento, pero eso no puede hacerlo. Decide entonces volver a llamar a Isabel y plantearle su duda, prometiéndole que le debe una cena en compensación por su ayuda y por poder contar con ella ante cualquier problema.

Imagen de un botón con las siglas OCR de Reconocimiento Óptico de Caracteres.

Una de las utilidades que proporcionan actualmente los dispositivos de digitalización como los escáner, es el reconocimiento óptico de caracteres (ROC en castellano, aunque es más conocido como OCR en inglés), eso significa que podemos digitalizar un texto y con el software adecuado convertirlo en un documento tal y como si hubiese sido tecleado, normalmente el escáner viene con un disco que trae este tipo de software entre otros, y los mejores de ellos incluyen versiones para todos los sistemas operativos.

Digujo de un escáner para digitalizar imágenes y documentos.

Resulta evidente la utilidad de este software, especialmente cuando se trata de copiar informes o parte de ellos, pero hay que advertir que en contadas ocasiones esa traducción está libre de errores y siempre es preciso retocar los saltos de línea, aunque las últimas aplicaciones informáticas de este tipo están presentando resultados espectaculares.

Para llevar a cabo la digitalización de un texto y convertirlo en un documento, es necesario disponer de una serie de elementos:

  1. Elementos Hardware: un escáner, para digitalizar el texto.
  2. Elementos Software: el programa OCR, que permite reconocer los caracteres y traducirlos a un documento de nuestro procesador de texto.
Para saber más

Si te parece interesante este tema puedes encontrar más información en los siguientes enlaces. El primero de ellos es una introducción muy clara que se hace en la Wikipedia y en la que puedes encontrar más enlaces interesantes.

Te proponemos también que visites la siguiente página en la que puedes probar un programa OCR gratuito. Sólo tienes que enviar un archivo con texto para que lo reconozca y convertirlo a texto, tal y como lo obtendrías tras teclearlo.

Autoevaluación
De los siguientes elementos informáticos indica cuáles son básicos para digitalizar un documento al que le vamos a aplicar un programa OCR.
Escáner.
Disco óptico.
Software reconocedor de caracteres ópticos.
Hoja de cálculo.