Inicio > info, tutoriales > Reconoce el texto de tus imágenes y conviértelas a texto rápidamente con OCR…

Reconoce el texto de tus imágenes y conviértelas a texto rápidamente con OCR…


Capture 2 Text te permite hacer lo siguiente:

  • Reconocimiento óptico de caracteres (OCR)
    permite al usuario rápidamente instantánea una pequeña porción de la pantalla, OCR y (por defecto) guardar el resultado en el portapapeles.
  • Reconocimiento de voz
    mediante reconocimiento de voz el usuario puede hablar en su micrófono y Capture 2 Text convertirá el habla en texto. Si la tecnología de reconocimiento de voz no es 100% seguro, Capture 2 Text presentará al usuario una lista de las más probables transcripciones. El resultado seleccionado (por defecto) se copia en el portapapeles.

Lo genial de Capture 2 Text, es que es capaz de reconocer cualquier texto que aparezca en la pantalla. Basta con descomprimir el zip (no tiene archivo de instalación) y Capture 2 Text residirá en nuestro system tray. Cuando queramos identificar algo en pantalla, basta con presionar la tecla de Windows y “Q”, utilizando el mouse para resaltar la parte a copiar (similar a tomar una captura de pantalla).

Inmediatamente, Capture 2 Text copiará el texto (como texto) a nuestro portapapeles.

 

 

 

Otra de las funciones que Capture 2 Text trae, es la posibilidad de reconocer voz a través del motor de reconocimiento de Google.

Por defecto, los idiomas incluidos para el reconocimiento de imágenes, son Chino, Inglés, Francés, Alemán, Japonés y Español, con la posibilidad de instalar 33 idiomas de manera individual (no incluídos, para mantener un tamaño más ligero). El programa es totalmente gratuito, y es una excelente manera de copiar rápidamente texto de imágenes. Y complementado con algo como Google Translate, podremos descifrar el texto en imágenes que estén en otro idioma.

 

Descarga:

http://sourceforge.net/projects/capture2text/files/latest/download?source=files

 

Información adicional:

 

Capture 2 Text OCR soporta los siguientes idiomas:

Búlgaro Húngaro Ruso
Catalán Indonesio Serbio
Chino Italiano Eslovaquia
Checo Japonés Esloveno
Danés Coreano Español
Holandés Letón Sueco
Inglés Lituano Tagalog
Finlandés Noruego Turco
Francés Polaco Ucranio
Alemán Portugués Vietnamita
Griego Rumano  

Nota: Por defecto sólo Chino, Inglés, francés, alemán, japonés y español están instalados.

Para adquirir otros idiomas:

  1. Descargue los diccionarios adecuados OCR de idiomas desde la página web de Tesseract OCR .
  2. Descomprimir el diccionario del idioma de OCR en Capture2Text \ Utils \ tesseract \ tessdata
  3. Reinicie Capture 2 Text

Uso de OCR

Pulse la tecla de captura OCR (predeterminado: tecla de Windows + Q) para iniciar la captura. Ahora, con el ratón, cambiar el tamaño del cuadro de captura sobre el área de la pantalla que desea OCR. Una vista previa del texto OCR’d capturada aparecerá en la esquina superior izquierda de la pantalla. Pulse la tecla de captura o el botón izquierdo del ratón para completar la captura. El área de la pantalla capturada se OCR’d y el resultado textual se almacena en el portapapeles de forma predeterminada.

Para cancelar una captura OCR, pulse Esc.

Para mover el cuadro de captura, mantenga pulsado el botón derecho del ratón y arrastre el ratón.

Para empujar la caja de captura, utilice las teclas de flecha.

Para cambiar el ángulo de captura de caja activa, pulse la barra espaciadora.

Para cambiar el idioma de OCR, haga clic en el icono de la bandeja Capture 2 Text, seleccione la opción Idioma de OCR y seleccione el idioma deseado.

Para cambiar el languange OCR, haga clic en el icono de la bandeja Capture 2 Text y seleccione Configuración -> Idioma de OCR.

Para alternar rápidamente entre los 3 idiomas, utilice las teclas de idioma de OCR de acceso rápido: Tecla de Windows + 1, la tecla de Windows + 2, y la tecla de Windows + 3.

Cuando las versiones de Tesseract chino o japonés están seleccionados, debe especificar la dirección del texto (vertical u horizontal) con la tecla de dirección del texto: Tecla Windows + W. La dirección del texto no tendrá ningún efecto sobre los chinos NHocr y diccionarios japoneses.

El cuadro de diálogo Preferencias, puede cambiar la configuración de OCR siguientes:

  • Teclas de acceso directo de OCR.
  • Idioma actual OCR.
  • Los 3 Quick-Access Idiomas OCR.
  • Captura de la caja de color y la opacidad.
  • Activar / desactivar el cuadro de vista previa y cambiar su color, tipo de letra y la opacidad.
  • Cambiar la dirección del texto (utilizado para el chino y japonés).

Reconocimiento de voz

Capture 2 Text puede llevar a cabo el reconocimiento de voz para los siguientes idiomas:

Africaans Francés Polaco
Chino Alemán Portugués
Checo Italiano Ruso
Holandés Japonés Español
Inglés Coreano Turco

Speech Recognition Uso

Pulse la tecla de captura de reconocimiento de voz (por defecto: tecla de Windows + A) para iniciar la captura. Verá una casilla que dice “Grabando …” en la esquina superior izquierda de la pantalla. Habla una palabra o una frase o una oración por el micrófono. Capture 2 Text reconocerá automáticamente cuando haya terminado de hablar y se mostrará un cuadro que dice “Analizando …”. El reconocimiento de voz le tomará un par de segundos. Cuando el reconocimiento de voz se ha completado, verá una lista de posibles transcripciones para elegir. Cuando se elige una transcripción, se almacena en el portapapeles por defecto.

Cuando los resultados de las ventanas en la pantalla, puede pulsar Enter para seleccionar la primera transcripción o utilice las teclas numéricas (1-9) para seleccionar la correspondiente transcripción.

Para cancelar una captura de reconocimiento de voz, presione la tecla Esc.

Para cambiar el idioma de reconocimiento de voz, haga clic en el icono de la bandeja Capture2Text, seleccione la opción Idioma de reconocimiento de voz y seleccione el idioma deseado.

Para alternar rápidamente entre dos idiomas, utilice la tecla de reconocimiento de voz idioma: Tecla Windows + 4.

El cuadro de diálogo Preferencias, puede cambiar la configuración del discurso siguientes reconocimientos:

  • Teclas de acceso rápido de reconocimiento de voz.
  • Idioma actual discurso de reconocimiento.
  • Los dos idiomas de reconocimiento de voz para alternar entre ellos.
  • Las propiedades de la ventana de resultados (tipo de letra, color, número de resultados).
  • ¿Cuánto silencio hay que esperar antes de que la grabación se detenga?.

Opciones de salida

De forma predeterminada, el texto o el habla OCR’d reconocido se coloca en el portapapeles.

Usted también tiene más 3 maneras de la salida del texto.

Para enviar el texto a una ventana pop-up que puede hacer clic en el icono de la bandeja Capture 2 Text y seleccione Mostrar ventana emergente.

Para enviar el texto a cualquier cuadro de texto contiene actualmente el cursor parpadeante / I-beam, haga clic en el icono de la bandeja Capture 2 Text y seleccione Enviar a Cursor.

Avanzado: Para enviar el texto directamente a una ventana / control (por ejemplo, el Bloc de notas + +), primer llenado en Enviar para controlar la configuración del cuadro de diálogo Preferencias. Una vez hecho esto usted puede activar / desactivar la opción, haga clic en el icono de la bandeja Capture2Text y seleccionando Enviar a Control.

El cuadro de diálogo Preferencias, puede cambiar la configuración de salida siguientes:

  • Texto para anteponer / anexar al texto digitalizado.
  • Activar / desactivar la salida en el portapapeles.
  • Activar / desactivar la salida en una ventana emergente.
  • Propiedades de ventana emergente (ancho y altura por defecto).
  • Activar / desactivar el envío del texto de salida para el cursor.
  • Activar / desactivar la salida a un control.
  • Comando adicional para enviar a la salida de control.

Configuración

Haga clic en el icono de la bandeja Capture 2 Text en la parte inferior derecha de la pantalla y luego seleccione la opción “Preferencias …” opción para abrir el cuadro de diálogo Preferencias.

Sustituciones

A veces Capture 2 Text consistentemente comete los mismos errores de OCR, como el reconocimiento de una “M” como “I \ / |”.

Al editar el archivo en el directorio subtitutions.txt Capture 2 Text, usted puede decirle Capture 2 Text para sustituir una cadena de texto por otra cadena de texto.

Sólo tienes que encontrar la sección de lenguaje apropiado y añadir una sustitución por línea en este formato: from_text = TO_TEXT

Ejemplo (2 sustituciones añadir a la sección en Inglés):

Inglés:
I \ / | = M
> <= X

 

Para crear una sustitución sin importar el idioma, agregue la sustitución al “Todos:” sección.

Símbolos especiales y caracteres de escape:

%% A_Space Carácter de espacio único
%% A_Tab Solo carácter de tabulación
%% Igual Igual (=)
`, Coma (,)
`% Signo de porcentaje (%)
Acento grave (`)
`N Carácter de salto de línea simple (\ n)
`R Single carácter de retorno de carro (\ r)

Puede desactivar una sustitución mediante la adición de un “#” delante.

Opciones de línea de comandos

Usted puede OCR la pantalla a través de línea de comandos llamando Capture 2 Text en este formato:

Capture2Text.exe x1 y1 x2 y2 [output_file]

Los argumentos necesarios:
x1 – X1-coordenadas de la pantalla
y1 – Y1-coordenadas de la pantalla
x2 – X2-coordenadas de la pantalla
y2 – Y2-Coordenada de la pantalla

 

Argumentos opcionales:
output_file – El texto OCR’d se escribirá en el archivo si se especifica.

Capture 2 Text leerá settings.ini para definir parámetros como idioma de OCR y opciones de salida (portapapeles, ventanas emergentes, etc.)

Ejemplos:
Capture2Text.exe 10 152 47 321 output.txt
Capture2Text.exe 10 152 47 321
Categorías:info, tutoriales Etiquetas: ,
  1. 18 octubre, 2012 a las 11:14

    Wonderful blog you have here but I was wanting to know if you knew of any discussion boards that cover the same topics discussed in this article? I’d really like to be a part of online community where I can get feedback from other knowledgeable individuals that share the same interest. If you have any suggestions, please let me know. Kudos!

  2. 20 octubre, 2012 a las 04:51

    Just desire to say your article is as astonishing. The clarity in your post is simply cool and i can assume you’re an expert on this subject. Well with your permission let me to grab your feed to keep up to date with forthcoming post. Thanks a million and please continue the gratifying work.

  1. No trackbacks yet.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: