¿existe algún programa que haga OCR a subtitulos?

Foro dedicado en exclusividad a los subtítulos en el cine clásico. Aportaciones personales, sincronía, subtítulos ajenos o ripeados, peticiones, etc.
cesoto
Mensajes: 343
Registrado: Dom 06 Oct, 2002 02:00
Ubicación: Santiago de Chile

¿existe algún programa que haga OCR a subtitulos?

Mensaje por cesoto » Mar 21 Ene, 2003 20:05

Hola, tengo un par de dudas:

1- Quisiera saber si existe algún programa que capture video analógico (vhs) pero solamente una zona de éste, por ej. la típica barra negra inferior en donde en ocasiones estan los subtitulos incrutados.

2-Si logro capturar esa zona que tiene los subtitulos existe algun programa que capture via OCR estos subtitulos y ademas capture los tiempos que duran cada uno de ellos.



bueno les dejo esa inquietud

saludos

[Editado el 21/1/2003 por cesoto]
"De todas las superticiones que la creencia en la Historia alimenta, la más notable es la del progreso."

EM Cioran

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

¿existe algún programa que haga OCR a subtitulos?

Mensaje por bobalote » Mar 21 Ene, 2003 22:00

JE JE Ripeando subtitulos de VHS ? :D

Si, se puede, pasate por: http://x.arkania.org/phpnuke/modules.ph ... ad&tid=951

Suerte

taperwhere
Mensajes: 40
Registrado: Lun 30 Sep, 2002 02:00

¿existe algún programa que haga OCR a subtitulos?

Mensaje por taperwhere » Mar 21 Ene, 2003 22:12

Lo de capturar una zona del vhs es facil.
Con el virtualdub seleccionas File->capture avi. (lo tendras que tener configurado según de donde y como quieras capturar, si tienes problemas en este punto avisa, y te lo ocomento).
Una vez en la pantalla de captura, vas a Video->Clipping y marcas enable, vuelves a video-> Clipping y entras en set bounds. Ahí podrás seleccionar la zona que quieres capturar.

Con esto tendrias una captura de la zona de los subtitulos.

Ahora viene la parte del OCR, que a mi no me funcionó pero que pudo ser por la calidad del video y porque tampoco tengo mucha experiencia capturando.
Primero tendras que tener el filtro sublog (los puedes encontrar aquí)
Cargas con el virtualsub la captura que hiciste y despues cargas el filtro. Cuando cargas este último aparece una ventana donde puedes configurar cosas como el color de las letras de la fuente (en el link que puse para descargarte el filtro te explican el resto de opciones, eso si, en inglés).
Una vez cargado el filtro vas a File y le das a preview, que te creará dos archivos uno .sub y otro .idx.

El programa que utilicé yo para hacer el OCR fue el subrip, pero a partir de aquí casi fui dando palos de ciego, así que, puede ser que meta la pata en algún paso.
Abres el subrip y cargas el archivo .sub que generaste antes y comienza la extracción por OCR en el botón start que te aparece a la derecha (mira que esté seleccionada la casilla OCR un poco más arriba).
Supuestamente funciona, pero a mi no me dio mucho resultado, espero que tengas más suerte que yo.
De todos modos, si lo pruebas me gustaría saber como te ha ido para corregir posibles errores en lo que hice.

Un saludo.

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

¿existe algún programa que haga OCR a subtitulos?

Mensaje por bobalote » Mar 21 Ene, 2003 22:19

TAPER:
Que codec utilizaste para la captura?
Que tarjeta cap tienes?
Cual era la fuente (VHS, TV, SAtelite)?

De cualquier manera el SUB y el IDX pueden ser utilizados directamente con el reproductor con el programa VOBSUB.
Aunque la calidad no sea lo suficientemente buena como para reconocer los caracteres mediante OCR siempre se pude vizualizar (El ojo humano es la mejor herramienta OCR :D )

cesoto
Mensajes: 343
Registrado: Dom 06 Oct, 2002 02:00
Ubicación: Santiago de Chile

¿existe algún programa que haga OCR a subtitulos?

Mensaje por cesoto » Mar 21 Ene, 2003 23:20

MUCHAS GRACIAS POR LA INFO.


una duda bobalote entonces con esos programas que tu dices no es necesario capturar el video? ¿con solo ejecutar la pelicula el programa captura los sub en tiempo real?

------------------------------------

Por lo pronto en la pelicula que me interesa ocupar este sistema es Pillow Book de Peter greenaway ( los sub no estan en ningun idioma) lo bueno es que en la mayoria de las parte el sub esta en un fondo negro, asi es que imagino que es mas facil. y tengo un vhs con sub al español en buena calidad, asi es que veremos que resulta.

Aunque no tengo captura de video analogica.. :D

pero veremos que hago.

saludos y gracias



Aunque

[Editado el 21/1/2003 por cesoto]
"De todas las superticiones que la creencia en la Historia alimenta, la más notable es la del progreso."

EM Cioran

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

¿existe algún programa que haga OCR a subtitulos?

Mensaje por bobalote » Mié 22 Ene, 2003 00:05

Bueno en teoria no es necesario capturar el video pero necesitas una maquina realmente potente. Yo no poseo tal equipo asi que no lo puedo probar.
Pero me parece que para obtener mejores resultados deberias capturar 1ro el video. Es una buena oportunidad de hacer una copia de seguridad. :)
Para obtener mejores resultados te recomiendo el codec huffyuv , ya que es un codec que no produce degradacion en el video. Eso si las capturas con este codec ocupan Mucho espacio. Luego le pasas los filtros mencionados y si quieres luego lo pasas a DIVX o XVID para guardarlo.

PD:
Con capturas de satelite o otros sistemas digitales (directv y similares) y una capturadora tipo BT 7?8 se obtienen resultados realmente asombrosos, comparables a un DVD Rip.

taperwhere
Mensajes: 40
Registrado: Lun 30 Sep, 2002 02:00

¿existe algún programa que haga OCR a subtitulos?

Mensaje por taperwhere » Mié 22 Ene, 2003 00:07

te respondo, bobalote:
no usé nada de compresión (no controlo demasiado el tema y decidí hacerlo sin usar ningún codec)
la tarjeta es una avermedia de las corrientuchas (no sé ahora mismo el modelo ;))
la fuente era un vhs bastante cascado del Plan 9 from other space.

Supongo que todo este cúmulo de despropósitos unido a mi nula experiencia capturando (era y es la primera vez que lo hice), propició que el resultado fuera practicamente nulo.

De todos modos probaré el Vobsub (espero saber como funciona) y te comentaré los resultados.

Muchas gracias por el consejo y un saludo. :)

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

¿existe algún programa que haga OCR a subtitulos?

Mensaje por bobalote » Mié 22 Ene, 2003 00:31

ALgun codec habras utilizado porque sin ningun codec seria RGB y ocupa Mucho espacio. Pero MUCHO y no creo que la maquina se pueda capturar asi a pelo porque habria perdidas de frames (No daria la velocidad del disco)
Si la avermedia es PCI seguro que utiliza el chipset BT 8?8. El chipset tiene muchas posibilidades pero los integradores no realizan generalmente un buen trabajo a la hora de hacer drivers para este tipo de tarjetas.
Una opcion interesante es bajarte un driver alternativo desarrollado para capturas. ir a : http://btwincap.sourceforge.net/

Ya que ¨plan 9... ¨ es en blanco y negro no deberia haber mayores problemas.

El VOBSUB funciona como un dvd, superpone la imagen de los subtitulos a la imagen de la pelicula.

Suerte y por favor cuantanos de tus experiencias

cesoto
Mensajes: 343
Registrado: Dom 06 Oct, 2002 02:00
Ubicación: Santiago de Chile

¿existe algún programa que haga OCR a subtitulos?

Mensaje por cesoto » Mié 22 Ene, 2003 03:21

Estoy probando con un divx y he llegado hasta lo del SUB y el IDX y de ahi ni idea que hacer.


:(
"De todas las superticiones que la creencia en la Historia alimenta, la más notable es la del progreso."

EM Cioran

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

¿existe algún programa que haga OCR a subtitulos?

Mensaje por bobalote » Mié 22 Ene, 2003 19:40

Le estas pasando los filtros a un divx?

Si es asi no creo que obtengas buenos resultados ya que el codec divx siempre hace perder calidad de video original. Se ve muy bien pero pierde calidad sino prueba a pausar un video y ves la calidad pobre que tiene en imagen por imagen.

Si me pasas mas datos a lo mejor te puedo ayudar

cesoto
Mensajes: 343
Registrado: Dom 06 Oct, 2002 02:00
Ubicación: Santiago de Chile

¿existe algún programa que haga OCR a subtitulos?

Mensaje por cesoto » Mié 22 Ene, 2003 21:02

si pero es solo para probar y aprender el proceso, pero he quedado si saber que hacer luego de generar los archivos SUB y el IDX con el filtro instalado en el virtual dub.

¿quien sabe que hay que hacer luego?



saludos
"De todas las superticiones que la creencia en la Historia alimenta, la más notable es la del progreso."

EM Cioran

taperwhere
Mensajes: 40
Registrado: Lun 30 Sep, 2002 02:00

¿existe algún programa que haga OCR a subtitulos?

Mensaje por taperwhere » Mié 22 Ene, 2003 22:01

Prueba lo que te explico arriba, ejecutas el subrip abres el .sub y le das al botón start.

Despues tendras que seleccionar un color (creo que te da 4 opciones) hasta que veas el fotograma en negro y las letras en blanco.

Después te irá señalando letras sueltas en fotogramas que tu le tendras que decir cuales son (para que vaya aprendiendo).

Si tienes problemas, avísame en donde te quedaste atrancado.
Mientras intentaré buscar una página que encontrara que lo explicaban mejor (con fotos y tal)

cesoto
Mensajes: 343
Registrado: Dom 06 Oct, 2002 02:00
Ubicación: Santiago de Chile

¿existe algún programa que haga OCR a subtitulos?

Mensaje por cesoto » Mié 22 Ene, 2003 22:52

pero el subrip (v: 097b) solo abre archivos *.ifo,*.vts y *.vob ?
¿o me falta inslatar algo?



gracias por la ayuda
"De todas las superticiones que la creencia en la Historia alimenta, la más notable es la del progreso."

EM Cioran

taperwhere
Mensajes: 40
Registrado: Lun 30 Sep, 2002 02:00

¿existe algún programa que haga OCR a subtitulos?

Mensaje por taperwhere » Mié 22 Ene, 2003 23:30

La versión que tengo del subrip es la 1.14.
Por lo demás no creo que tengas que tener nada más. (Por problemas técnicos y por cierto bastante cabrones, he tenido que formatear y reinstalar mi pc hoy mismo y acabo de instalarlo ahora sin nada mas y me funcionaba).

De todos modos el procedimiento que sigo es:
File-> open VOB(s)
despues aparece una ventana donde aparece una sección llamada VOB(sub) files: y un pelín más abajo "open dir".
Dándole al open dir puedo seleccionar archivos o .vob o .sub.

Un saludo.

cesoto
Mensajes: 343
Registrado: Dom 06 Oct, 2002 02:00
Ubicación: Santiago de Chile

¿existe algún programa que haga OCR a subtitulos?

Mensaje por cesoto » Mié 22 Ene, 2003 23:48

Gracias!! ;) el problema era la version del subrip, baje la 1.14 y se pueden abrir .sub

ahora voy a ver como me va.


saludos
"De todas las superticiones que la creencia en la Historia alimenta, la más notable es la del progreso."

EM Cioran

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

¿existe algún programa que haga OCR a subtitulos?

Mensaje por bobalote » Jue 23 Ene, 2003 02:07

Un paso intermedio que siempre funciona es usar esos SUB e IDX con el VOBSUB.
Siempre funciona, ya que los subtitulos se guardan como imagenes y no como texto.
No creo que obtengas buenos resultados pasandole el subrip pero cuentanos como te fue
Saludos

cesoto
Mensajes: 343
Registrado: Dom 06 Oct, 2002 02:00
Ubicación: Santiago de Chile

¿existe algún programa que haga OCR a subtitulos?

Mensaje por cesoto » Jue 23 Ene, 2003 04:08

probe con una pelicula que tiene los sub encima de la imagen y los resultados fueron malisimos, pero imagino que si los sub estan en fondo negro los resultados seran mejores.
¿como eso de usar los SUB e IDX con el VOBSUB?


saludos
"De todas las superticiones que la creencia en la Historia alimenta, la más notable es la del progreso."

EM Cioran

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

¿existe algún programa que haga OCR a subtitulos?

Mensaje por bobalote » Jue 23 Ene, 2003 17:52

Intalas el vobsub, renombras los .SUB y Los .IDX con el mismo nombre que la pelicula y los metes en un directorio y automaticamente cuando corres la peli se cargan los subtitulos.

Con una pelicula con los sub incrustados en la imagen y con el codec divx. No obtendras buenos resultados para OCR pero prueba de verlos directamente con el vobsub.
Si la pelicula esta en algun codec ¨loseless¨, como huffyuv , YUV o directamente RGB :P , y configurando bien el filtro SUBLOG puedes obtener resultados aceptables.

Si los subtitulos estan en ¨banda negra¨ y el codec es divx o mpg se obtienen muy buenos resultados.
Si es una captura de algun sistema digital o un buen VHS y el codec es ¨Loseless¨ los resultados son muy buenos y el preceso es casi automatico.

Avatar de Usuario
tirapalla
Mensajes: 2519
Registrado: Mar 30 Mar, 2004 02:00

Mensaje por tirapalla » Jue 05 May, 2005 13:21

Vamos a reabrir el debate en este hilo.

Unas preguntitas ...

Cuando la captura es en unos subs que están encima de una imagen (no sobre fondo negro) supongo que los resultados no serán muy buenos para luego pasarlo por el subrip, pero ¿los tiempos de los subs los hace bien?

si es así, eso ahorraría mucho trabajo, ya que luego con una ventana con el video de los subs por un lado, y en la otra el subtitle workshop con los srt que hayamos creado, podemos ir transcribiendo los subs, que trabajo, pero menos que hacerlo desde cero.

Aprovecho para pedir que algún moderador mueva este hilo a "Subtitulos General" que es donde debería estar.

Avatar de Usuario
xaniox
Mensajes: 2311
Registrado: Vie 02 Ago, 2002 02:00
Ubicación: Sevilla

Mensaje por xaniox » Jue 05 May, 2005 21:14

Pásate por este hilo, tirapalla:

Otro Estupido Método de Extraccion de Subtitulos Incrustados

Allí se habla del programa AviSubDetector que consigue eso que dices: extraer los tiempos creando un srt "vacío" en el que luego se pueden ir transcribiendo frases. Yo he sacado varios subtítulos con ese método aunque la verdad es que resulta complicado (al menos al principio) y hay que pelearse mucho con el programa.

Por cierto, el S. Workshop tiene una opción que es la "Vista previa con vídeo" así que no hay que usar reproductor externo para ir viendo y copiando el texto de los subs.

El AviSubDetector también trae una opción OCR pero que no he logrado hacerla funcionar correctamente en subs que no están sobre fondo negro.

Salu2