¿Por qué "l" por "I"? y otros errores en

Foro dedicado en exclusividad a los subtítulos en el cine clásico. Aportaciones personales, sincronía, subtítulos ajenos o ripeados, peticiones, etc.
el_salmonete
Mensajes: 1468
Registrado: Sab 16 Abr, 2005 02:00

¿Por qué "l" por "I"? y otros errores en

Mensaje por el_salmonete » Sab 04 Jun, 2005 00:23

Es tan sólo una curiosidad. Es frecuente encontrarse en los subtítulos que circulan por aquí las letras cambiadas, y me gustaría saber por qué. Me imagino que será cosa de pasar del formato original del DVD a .srt o.sub.
También se encuentran a menudo espacios entre los signos de interrogación y el texto: "¿ Qué...?". ¿Alguien sabe por qué ocurre esto?

Avatar de Usuario
psikonauta
Mensajes: 91
Registrado: Dom 07 Nov, 2004 01:00

Mensaje por psikonauta » Sab 04 Jun, 2005 00:28

El método de extracción de subtítulos de las películas (o uno de ellos) es OCR (que no sé qué significa), lo que hace el programa es reconocer imágenes (las letras, números, etc), a las que tu tienes que indicar lo que representan (una X, una Ñ, un 7, etc.). Como la 'l' i la 'I' son tan parecidas, es frecuente que el programa no detecte la diferencia y las cambie.

Lo de los interrogantes ni idea, será algo parecido, algún error al pasar la imagen a texto.

Avatar de Usuario
cernickalo
Mensajes: 2632
Registrado: Dom 19 Dic, 2004 01:00
Ubicación: En la máquina de las palomitas

Mensaje por cernickalo » Sab 04 Jun, 2005 00:30

Pues tan sólo depende de dos cosas:

- Que los subtítulos utilicen un tipo de letra tal que la "l" y la "I" tengan el mismo aspecto, y como SubRip no es más que un programa de reconocimiento óptico de caracteres las tome por la misma letra.

- Y que el que ha preparado los subtítulos no los repase... o se le pase por alto alguna de estas erratas.

Así de sencillo.

Avatar de Usuario
raul2010
Mensajes: 3203
Registrado: Mié 24 Jul, 2002 02:00

Mensaje por raul2010 » Sab 04 Jun, 2005 00:32

Jeje, se nota que no has extraído nunca subs de un DVD ;)

Cuando extraes subs estos se encuentran en formato imagen dentro del DVD, es decir, son un montón de fotos de texto con fondo transparente.

Para pasar eso a texto (y ganar mucho espacio, lógicamente) usamos programas que hacer OCR (Optical Character Recognition) como SubRip, por ejemplo.

Ese tipo de soft te presenta muestras del texto para que le digas de qué letra se trata en cada caso. Como sabrás, hay varias fuentes en las que la L minúscula y la I mayúscula son exactamente iguales. Como lo primero que suele preguntar es la L, pues se queda L para todo el documento.

Esto evidentemente se puede corregir semiautomáticamente, pero lo mejor y lo más sabio es hacer una revisión a fondo (y a mano) de los subs que publicamos.

Lo mismo vale para los espacios entre signos de puntuación que comentas.

Por cierto, que para no ver esos errores de L e I, lo mejor que puedes hacer es poner la fuente de tus subs en Arial :mrgreen:

salu2

edito: juer, qué rápidos sois y qué oxidado me veo :roll:

Avatar de Usuario
ectoplaxma
Mensajes: 846
Registrado: Jue 29 May, 2003 02:00

Mensaje por ectoplaxma » Sab 04 Jun, 2005 01:24

A veces me pasa que al extraer subs, el OCR solo me reconoce pixels sueltos de cada letra, no la letra entera. no sé si me explico. Y ahí se forma un lio de la leche, no sé si eso tiene solución.

Como esto:

Imagen

Avatar de Usuario
xaniox
Mensajes: 2311
Registrado: Vie 02 Ago, 2002 02:00
Ubicación: Sevilla

Mensaje por xaniox » Sab 04 Jun, 2005 07:07

Wenas ectoplaxma

En ese caso que mencionas yo intentaría hacer dos o tres cosillas:

- No introducir ningún caracter y pulsar "OK" para ver si a continuación el programa lo que detecta es la "h" esa que muestras pero completa.

- Si eso no funciona, pulsar en "Cambiar color txt" y elegir un par de colores que te permitan seguir con el OCR (aunque no siempre suele resultar)

- En el caso en que las dos opciones anteriores no dieran resultado probaría a hacer el OCR con una aplicación que se instala junto con el VobSub llamada subresync. Cuando se me ha presentado algún caso como el que comentas ha sido lo más eficaz.

Salu2

Avatar de Usuario
ectoplaxma
Mensajes: 846
Registrado: Jue 29 May, 2003 02:00

Mensaje por ectoplaxma » Vie 10 Jun, 2005 18:58

Gracias por la ayuda xaniox, no lo había leido hasta ahora.

Avatar de Usuario
jordisound
Mensajes: 232
Registrado: Dom 17 Abr, 2005 02:00

Mensaje por jordisound » Mar 19 Jul, 2005 00:54

en subrip hay una correccion post OCR donde está la opción substituir I por l. yo la he marcado pero me sigue confundiendo estas dos letras. por lo demás bien, pero esto mosquea un poco.
se podrian cambiar algunas otras opciones de correccion?. marcar italiano en lugar de inglés p. ej o no se?
si está explicado en otro foro como configurar subrip me dais el link' THNXS

Avatar de Usuario
javu61
Mensajes: 752
Registrado: Lun 02 Jun, 2003 02:00
Ubicación: Valencia (Spain)

Mensaje por javu61 » Mar 19 Jul, 2005 08:36

Hola:

No hay forma posible de que cuando la "I" y la "ele" son iguales para el OCR (si la I no tiene palitos horizontales es igual a una ele minuscula), no las confunda.

Pero hay una solución muy sencilla, cuesta 2 minutos y queda de cine. Simplemente abres el documento con un editor de textos, y pasas el corrector ortográfico, te aparecerán todos esos errores, y seguramente algún otro como la "i" minúscula y la admiración abierta "¡" o el cero "0" y la "O" mayúscula (aunque esta es mas rara), o el 1 y la ele minúscula (pasa en fuentes del tipo "Times").

No creas que habrá cientos de estos errores, normalmente no hay más de 20 en una peli, pero de paso localizas también alguna abreviatura erronea, o cuando falta algún espacio (pasa mucho despues de Dr.)

No cuesta mas de 5 minutos hacer la corrección, y quedan perfectos.

Jose Antonio

Avatar de Usuario
jordisound
Mensajes: 232
Registrado: Dom 17 Abr, 2005 02:00

Mensaje por jordisound » Mar 19 Jul, 2005 11:02

lo que comentas es abrirlo con el word p.ej. no?
vale, lo pensé, pero después a la hora de guardar tenia dudas sobre si se guardaria como .doc o seguiria siendo .srt, porque le das a guardar y te advierte de que se está guardando sin formato y se convierte en .txt no en .srt como estaba antes.
suponiendo que esto se pueda hacer, y que me lo expliqueis, tengo otra duda: que hago con los subtítulos en inglés, o en otro idioma, como los corrijo?
gracias por todo

Avatar de Usuario
javu61
Mensajes: 752
Registrado: Lun 02 Jun, 2003 02:00
Ubicación: Valencia (Spain)

Mensaje por javu61 » Mar 19 Jul, 2005 11:29

Hola:
jordisound escribió:lo que comentas es abrirlo con el word p.ej. no?
No quería dar marcas, pues luego los del Linux se quejan, pero si, lo puedes hacer con el Word o con el Open Office, o con otros que hay, que tengan el corrector ortográfico-
jordisound escribió:...le das a guardar y te advierte de que se está guardando sin formato y se convierte en .txt ...
Lo que dice es que lo guardará como "texto sin formato", que no como .txt. Yo lo hago y me respeta siempre la extensión .srt sin ningún problema, lo importante es que lo guarde como "texto sin formato", para que sea solo texto ASCII puro..
jordisound escribió:...que hago con los subtítulos en inglés, o en otro idioma...
Pues te instalas el corrector de ese idioma, y le dices que el texto está en inglés (o francés, o ruso o lo que sea), y te pasará el corrector. Eso también lo he hecho sin problemas para corregir unos en inglés y otros en francés, aunque si no concoes el idioma, es un poco mas dificil que te quede perfecto.

Lo dicho vale para cualquier procesador de textos con corrector en el idioma que quieras usar, los dos mencionados son válidos, el Word es de pago para Windows y Mac, y el Open Office es gratuito para Windows, Mac y Linux, aunque hay otros.

Jose Antonio

Avatar de Usuario
jordisound
Mensajes: 232
Registrado: Dom 17 Abr, 2005 02:00

Mensaje por jordisound » Mar 19 Jul, 2005 12:10

gracias compi por la claridez y celeridad de la respuesta
saludos

Avatar de Usuario
FLaC
Se alquila
Mensajes: 3079
Registrado: Vie 20 Jun, 2003 02:00
Ubicación: Left in the middle of fucking nowhere

Mensaje por FLaC » Mar 19 Jul, 2005 14:33

jordisound escribió:a la hora de guardar tenia dudas sobre si se guardaria como .doc o seguiria siendo .srt, porque le das a guardar y te advierte de que se está guardando sin formato y se convierte en .txt no en .srt como estaba antes.
Además de lo comentado por Javu61 otra cosilla que puedes hacer es: seleccionar todo el texto corregido, copiarlo, pegarlo en el bloc de notas y allí guardarlo como quieras.

Avatar de Usuario
shimoda
Mensajes: 1900
Registrado: Vie 15 Ago, 2003 02:00
Ubicación: En un sueño apócrifo

Mensaje por shimoda » Sab 23 Jul, 2005 10:58

joder, con los dolores de cabeza que me han dado tantas veces las jodidas I e l... y nunca se me había ocurrido esto... :?

gracias por el truco majetes :mrgreen:

saludos!

Long have you timidly waded holding a plank by the shore,
Now I will you to be a bold swimmer,
To jump off in the midst of the sea, rise again, nod to me, shout, and laughingly dash with your hair.