Otro Estúpido Método de Extracción de Subtítulos Incrustados

Para hablar y pedir ayuda sobre Hardware, Software y tal pascual, además de tutoriales para hacer tus copias privadas o configurar eMule.
bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

Otro Estúpido Método de Extracción de Subtítulos Incrustados

Mensaje por bobalote » Mié 28 Ene, 2004 19:03

Impresionante metodo de extraccion de Subtitulos de VHS/TV

Parecerá complicado pero no lo es. (Menos mal que no tengo que ganarme la vida como profesor :D )

**** Atencion no es un metodo OCR automatico, mas bien una generacion de Indice ****

A mi entender y despues de haberlo probado este programa abrirá un panorama enorme de subtitulos clasicos.

Necesitamos:

Capturadora
Codec Huffyuv (Y dale con el Huffyuv ;) )
VirtualDub
Paint (Lo trae el Windows, los prehistoricos recordarán que se llamaba PaintBrush ;) )
Y el "Amazing" AVISubDetector http://animeburg.boom.ru/Utils/AVISubDe ... nglish.rar

Primero hay que capturar normalmente salvo con algunas particularidades:

- En principio no nos interesa tanto la resolucion, por lo tanto nos quedaremos con resoluciones menores pare evitar el "Interlaceado".
- El area que queremos capturar es la que ocupan los subtitulos, por lo tanto "Cropearemos" para tener archivos algo menores.
En este punto hay que recordar que el HuffYuv trabaja con multiplos de 24.
Normalmente con 320X48 alcanza y sobra. Con esta resolucion y sin capturar el audio el Huffyuv "tragará" 2 gigas por hora.
- Todo lo anterior es valido si no nos interesa capturar la peli en si, caso contrario, capturar "Normalmente" y "Cropear" despues.
- Una vez capturada anotamos el frame donde exactamente empieza la peli.
- Todavia en el virtualdub: Buscamos un frame donde exista un subtitulo largo, vamos a "Video" "Snapshot Source Frame" y lo grabamos como BMP y como nombre le ponemos el numero de frame.
- Hacemos lo mismo pero con un subtitulo muy corto, uno "NO" o "SI" es ideal.

Le damos las gracias y cerramos el virtualdub.

Si el subtitulo no es blanco:

Abrimos el Paint:
- abrimos la imagen del subtitulo largo
- en "Ver" "tamaño grande"
- Ahora veremos que lo que nosotros veiamos como un solo color es en realidad una serie de colores deformados por el VHS, La captura, Etc.
- Seleccionamos el dibujo del pincel y despues el "gotero o cuentagotas" clickeamos sobre el subtitulo en un color que sea representativo del mismo con el boton izquierdo.
- y con el mismo boton "pintamos" un area un poco mas grande en algun lado de la imagen.
- Repetimos el proceso con 4 o 5 colores que juzguemos representativos.
- Guardamos la imagen resultante con el nombre "colores.bmp"

Hasta la vista, Paint

Y ahora nuestra arma secreta: El AVISubDetector.

Y el ejemplo que sigue es para una peli en B/N con los subtitulos en color (Amarillos) incrustados en la imagen:

- Lo primero que tenemos que hacer es seleccionar el "Color Dominante" del subtitulo. Le damos click al cuadrado Blanco que aparece debajo de "separation bu subtitle....."
- Aparece un pantalla nueva. Le damos a "sampleBMP" y cargamos el "colores.bmp" que habiamos creado con el Paint.
- Teoricamente el programa espera que clickemos sobre el subtitulo, pero como no tiene "zoom" y ya no vemos como antes clickearemos sobre las areas que habiamos "Pintado" antes. Primero el color "Principal". le damos a la tecla "=Dom". Y con el resto de los colores importantes hacemos lo mismo pero con la tecla "+Dom"
- Sin cerrar la pantalla nueva volvemos a la principal, donde antes aparecia el cuadrado blanco ahora aparecen "nuestros colores"
- En el "Readme" estan explicados los pasos principales y la teoria completa de operacion. Y nos da una idea bastante aproximada de lo que tenemos que hacer.
- En principio poner el "BlockValue" en 150 o 100 porque nuestra imagen es algo "ruidosa" y el "Skip change if distance is" en 20 para que no repita tanto los subs.
- Y el "Slider" que esta sobre "Drop Values" un punto hacia la izquierda.
- Y como nosotros ya habiamos cropeado la imagen le damos a "Full"
- Volvemos a la psntalla de los bmp y cargamos el frame del subtitulo corto.
- Con los botones "CheckBV" y "L" testeamos nuestra configuracion. En la izquierda aparece un grafico de barras negras (parecido a un grafico de audio) y una linea vertical negra (que nos "muestra" nuestros settings). Si las barras negras superan la linea negra aparece una linea verde nueva (y el sub es detectado)
- En el frame del subtitulo corto nos interesa que la linea verde este lo mas cercana posible a la negra. (de esta forma no perderemos ningun subtitulo y a la vez evitamos muchos falsos)
- Probamos lo mismo con el frame del subtitulo largo.
- Ahora que tenemos casi todo el trabajo hecho podemos cargar la peli: "Add avi" en "Start/continue from frame" le ponemos el frame donde comenzaba la peli (lo habiamos anotado en el VirtualDub, ¿recuerdas?)

Y antes de empezar explicaré brevemente algunas funciones que no están explicadas:
"Scrip" es el subtitulo. "Ignore Empty" ignora los "vacios" sino nos crea una linea de sub cuando empieza y una cuando termina. (2 subs por linea)
"Show Last Line" va mostrando simepre el ultimo sub, marcarla. "Controlled Empty" nos pide confirmar cada vez que termina un sub y es muy complicado, desmarcarla.
El programa tiene dos modos de trabajo el "automatic" y el "manual control mode"
El automatic nos va creando un subtitulo en la informacion de los frames para procesarlos con programas tipo "workshop"
En el manual nos va apreciendo una pantalla y nos pide que escribamos lo que vemos en pantalla, realmente es una opcion comoda.
Para un peli normal en Automatic, el proceso de deteccion de Subtitulos tarda 20 minutos. Y en Manual, lo que tardemos en tipear.

Y despues de este breve intervalo seguimos:

- Ya teniamos la peli cargada, le ponemos de que frame empezar, lo ponemos en "automatic" y marcamos "Show last line"
- Movemos las 2 pantallas de manera que se vean las dos a la vez. Y le damos a "start"
- En una pantalla ira pasando el video a gran velocidad y en la otra iran apareciendo los subs.
- Si queremos hacer mas rapido le diremos que empiece por una parte muchos dialogos.
- Si vemos que los subs se detectan todos y no da "falsos Subs" lo dejamos asi, sino jugamos un poco con las opciones. El "Readme" da buenas pistas sobre esto.
- El programa siempre detecta los subtitulos "emergentes", pero cuando hay dialogos muy rapidos sule pasar que un subtitulo es remplazado inmediatamente por otro sin frames intermedios, es importante testear que con la configuracion que elegimos no se pierdan subs.
- Cuando tengamos la configuracion justa, de cualquier manera los "Defaults" son buenos, le damos a salvar settings.
- "Save Settings" guarda todo MENOS "skip change distance", "Deviation", el Frame inicial. Y lo mas importante NO guarda los colores. Pero para eso hicimos todo el rollo del Paint, siempre podemos repetirlo...

Y ya podemos dejarlo en automatico y trabajar despues con el Workshop o mejor ponerlo en manual y hacerlos directamente.

Este método sirve para Peliculas con subtitulos (Habladas), para pelis mudas pasar por: viewtopic.php?t=19860

Realmente es mucho mas dificil explicarlo que hacerlo. Animo y a probar...

Algunos TIPS:

- Siempre es mejor detectar "falsos subs" que no detectar los verdaderos.
- En el modo "manual" si el mismo subtitulo es detectado 2 veces se soluciona el boton "No change"
- Siempre pasarle un corrector ortografico al sub resultante para pulir errores de tipeo.
- No darse por vencido antes de empezar, si Bobalote puede..... ;)

Cualquier duda pregunten y prueben.

Saludos y buena caza.

Avatar de Usuario
xaniox
Mensajes: 2311
Registrado: Vie 02 Ago, 2002 02:00
Ubicación: Sevilla

Mensaje por xaniox » Mié 28 Ene, 2004 19:24

Enorme el curro, bobalote :plas: :plas:

Ya me gustaría utilizarlo pero sin capturadora... :roll:

Y por cierto, el enlace que pones para descargar el AviSub detector no funciona por algún problema de esa web.

Saludos

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

Mensaje por bobalote » Mié 28 Ene, 2004 19:28


Avatar de Usuario
raul2010
Mensajes: 3203
Registrado: Mié 24 Jul, 2002 02:00

Mensaje por raul2010 » Mié 28 Ene, 2004 20:04

tremebundo bobalote, le damos un 10 al profe :mrgreen:

a ver si se animan los poseedores de capturadoras, pq no ha sonado dificil :D

Avatar de Usuario
xaniox
Mensajes: 2311
Registrado: Vie 02 Ago, 2002 02:00
Ubicación: Sevilla

Mensaje por xaniox » Mié 28 Ene, 2004 22:00

Juer, el AviSub Detector es impresionante 8O

Acabo de probarlo (sin usar el Virtualdub ni el Paint) con el TVRip de "Scarface" y de momento me extrae los subtítulos perfectamente. Lo que no soy capaz de encontrar es la opción esa que comentas de "Ignore Empty" y me añade una línea más de subs.

¿Alguna ayuda? :D

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

Mensaje por bobalote » Mié 28 Ene, 2004 22:14

En el medio de la pantalla principal abajo de "Automatic Mode" se llama "Ignore Empty"....
Si esta marcada irán apareciendo unas "Señales" en el sub pero cuando se transforma en SRT no están mas....

Por cierto: Copio y pego para que no edites el mensaje ;)
con el TVRip de "Scarface" y de momento me extrae los subtítulos perfectamente
Esperamos ansiosos esa transcripcion :mrgreen:

Lo de usar el Paint es si el subtitulo NO es blanco y el virtual es para capturar....

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

Mensaje por bobalote » Jue 29 Ene, 2004 14:23

*** Atencion Todas la instrucciones son para la version 4.9 ***

Aparentemente acaba de salir una version nueva la 5.1. Le doy un vistaso y posteo los cambios...

Avatar de Usuario
xaniox
Mensajes: 2311
Registrado: Vie 02 Ago, 2002 02:00
Ubicación: Sevilla

Mensaje por xaniox » Jue 29 Ene, 2004 14:29

bobalote escribió:*** Atencion Todas la instrucciones son para la version 4.9 ***
A buenas horas... ImagenImagenImagen

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

Mensaje por bobalote » Jue 29 Ene, 2004 16:46

A buenas y primeras:

- El tamaño de los bloques es configurable!
- Desaparecen "=DOM" y "+DOM" y son reemplazados por clickeo para "=DOM" y clickeo derecho para "+DOM"
- Sigue sin guardar los colores, asi que habra que seguir con el rollo del Paint cuando el subtitulo no es blanco.

Y hay otras mejoras, Mas novedades en el proximo boletin desde el frente :mrgreen:

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

Mensaje por bobalote » Lun 02 Feb, 2004 16:33

Algunos comentarios sobre la version nueva:

Sobre una peli en Blanco y Negro son subtitulos en amarillo: Rapido y confiable, no pierde ni un subtitulo. Realmente se tarda lo que se tarda en tipear.

Sobre una peli en color con subtitulos en amarillo: Lo unico que le cambié a los seteos por default son:

"Skip if distance is" : 22
Drop values: 1 a la derecha

Y ademas le "cargue" 10 colores de subtitulos y le marque las casillas:

"Ignore blocks without color"
"asing maximun value"

Todo se puso un poco mas lento y da algunos falsos pero no pierde ninguno. Realmente se tarda lo que tardamos en tipear.

Creo que lo dificil ahora es conseguir material....

A ver quien se anima a probarlo y nos cuenta sus experiencias

Avatar de Usuario
xaniox
Mensajes: 2311
Registrado: Vie 02 Ago, 2002 02:00
Ubicación: Sevilla

Mensaje por xaniox » Lun 02 Feb, 2004 16:42

bobalote escribió:A ver quien se anima a probarlo y nos cuenta sus experiencias
Pues yo a estoy en fase de transcripción de subtítulos (aunque ahora no puedo dedicarle mucho tiempo) gracias a esta joya de programa.

En cuanto a lo de las opciones, lo hice en plan burro, con el infalible método del "ensayo-error" porque como sabes, las instrucciones que diste eran para una versión anterior del programa.

Cambiaba las opciones hasta que llegó un momento en que parecía que detectaba todos los subtítulos y dejé que los sacara hasta el final. Luego me encontré con que una línea de subs te la dividía en 2 o 3 (no todas) y que se comía algunos subs (los + cortos), pero nada que no se pueda solucionar echándole un poco de tiempo. El trabajo que te ahorra este programa es muy grande.

El caso es que ya tengo un archivo srt con todos los tiempos de los subs esperando para ponerle los textos, así que habrá noticias próximamente :mrgreen:

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

Mensaje por bobalote » Lun 02 Feb, 2004 16:43

Y como siempre, una vez que posteamos una novedad, esta queda desfasada... :roll:

Acaba de salir una nueva version:

La 5.26 bajarla de aqui: http://web.etel.ru/~shalcker/AVISubDetector_english.rar

A este paso en un mes ya capturará solo :)

A primera vista incorpora pre-Ocr!!! 8O No veo la hora de probarlo a fondo :x

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

Mensaje por bobalote » Lun 02 Feb, 2004 16:45

así que habrá noticias próximamente

¿Pongo a descargar "scarface"? :mrgreen:

Avatar de Usuario
xaniox
Mensajes: 2311
Registrado: Vie 02 Ago, 2002 02:00
Ubicación: Sevilla

Mensaje por xaniox » Lun 02 Feb, 2004 16:56

bobalote escribió:
así que habrá noticias próximamente

¿Pongo a descargar "scarface"? :mrgreen:
Así vas ganando tiempo... 8)

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

Mensaje por bobalote » Mar 03 Feb, 2004 16:23

Por un lado le informo a Xaniox que he terminado de bajar Scarface, asi que tendrá que mejorar su velocidad de tipeo... :mrgreen:

y por otro despues de probar la nueva version algunos comentarios:

- Los colores se graban en la configuracion! (No more Paint!!)

- se incorporan el grabado de series de bmp y filtros pre-Ocr con vistas a la exportacion para trabajar con el subrip y para crear vobsubs. (Quizas se pueda evitar el tipeo!)
Ademas si la exportacion grafica funciona se podria trabajar con pelis mudas tambien y crear subtitulos graficos para los intertitulos.

- Aparecen funciones estadisticas para el seteo de opciones y algunas nuevas.

En definitiva se requieren pruebas mas profundas (y un readme actualizado :D ) pero el estupido metodo se hace mas inteligente....

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

Mensaje por bobalote » Mar 10 Feb, 2004 18:01

Nueva version, mejora mucha la velocidad y corrige algunos bugs, todavia se extraña un readme actualizado...

La 5.2.6.5 bajarla de aqui: http://web.etel.ru/~shalcker/AVISubDetector_english.rar

Avatar de Usuario
superlopez
Mensajes: 1896
Registrado: Mar 30 Jul, 2002 02:00
Ubicación: Buscando villanos

Mensaje por superlopez » Mar 10 Feb, 2004 20:28

Vaya, esto lo tengo que probar. Gracias por el curro bobalote.

JotaP
Mensajes: 84
Registrado: Jue 08 Ene, 2004 01:00
Ubicación: Madrid

Mensaje por JotaP » Lun 15 Mar, 2004 23:54

Nueva version beta:

:arrow: Avisubdetector v.0.5.2.7 http://animeburg.omake.ru/download/util ... nglish.rar

No he tenido tiempo para probarla, aunque he visto que tiene bastantes cambios

Avatar de Usuario
xaniox
Mensajes: 2311
Registrado: Vie 02 Ago, 2002 02:00
Ubicación: Sevilla

Mensaje por xaniox » Mar 16 Mar, 2004 19:52

bobalote escribió:- se incorporan el grabado de series de bmp y filtros pre-Ocr con vistas a la exportacion para trabajar con el subrip y para crear vobsubs. (Quizas se pueda evitar el tipeo!)
Ademas si la exportacion grafica funciona se podria trabajar con pelis mudas tambien y crear subtitulos graficos para los intertitulos.
Cuando tengas un rato a ver si puedes explicar más detalladamente este proceso... Me conformo con una simple orientación porque yo le doy mil vueltas al programa y no saco nada en claro. Debo ser un poco torpe :oops: :oops:

Gracias

bobalote
Mensajes: 1119
Registrado: Lun 22 Jul, 2002 02:00
Ubicación: Ahora estoy aqui...

Mensaje por bobalote » Mié 17 Mar, 2004 21:12

Bueno intentare explicarme:

En el caso de pelis mudas esta resuelto ya que el programa permite la creaccion de vobsubs, en este caso tomamos el frame completo y listo. (en este caso el frame se mostraria sobre el frame original)

En el caso de los subtitulos el programa avanza en la posibilidad de hacer un Pseudo-OCR (con el subrip) para evitar el engorroso proceso de tipeo. Para eso el programa debe:
- Detectar cuando hay subtitulos.
- Homogeneizar la imagen los subtitulos.
- y exportarla en un formato que se pueda leer con el subrip.

El 2do paso es el clave ya que el Subrip trabaja con colores puros y cuando se captura el color de los subtitulos varia mucho. A mi entender esta opcion serviria solo para capturas Satrip o de Cable Digital. Ya que no se produce el "tilt" de colores.

Aunque todo lo anterior es valido para la version 2.6.5.... y en la 2.7 aparacen opciones de "Color Shift" que a primera vista son muy interesantes. 8O

Proximamente me voy a instalar un sistema Satelital y me comprare un TV asi que habra capturas y extracciones a monton....

Mas novedades en el proximo Boletin.... :mrgreen: