Ripeos de libros

Asuntos "fuera de temática". Recordad que el Respeto es Norma Primera e Innegociable.
Avatar de Usuario
rubiera
Mensajes: 343
Registrado: Sab 10 Ene, 2004 01:00
Ubicación: Roma la pagana.

Ripeos de libros

Mensaje por rubiera » Dom 26 Mar, 2006 20:30

Por qué no hacer copias de libros y compartirlas? Tengo varios libros que seguramente nunca han sido ni serán editados en Europa y me gustaría compartirlos y sacarlos un poco a la luz.
Por el momento se me ocurre escanearlos, pasarlos a formato pdf y meterlos en la mula a compartir. Si alguien tiene trucos, maneras y formas de hacer este trabajo lo más fácil posible agradecería sus consejos.
Saludos.
Imagen

Avatar de Usuario
Teeninlove
Mensajes: 1582
Registrado: Dom 25 Jul, 2004 02:00

Mensaje por Teeninlove » Dom 26 Mar, 2006 21:30

Pues para el OCR yo recomendaría el ABBYYY Fine Reader que a mí me ha dado buenos resultados.

Avatar de Usuario
Wladimirito
Mensajes: 294
Registrado: Jue 27 Ene, 2005 01:00
Ubicación: Llamémosle Vasconia...

Mensaje por Wladimirito » Dom 26 Mar, 2006 22:02

Estoy de acuerdo con Teeninlove, el FineReader es brutal, puedes guardar en PDF, en doc, pasar de PDF a doc... Además, te libera de la pesadilla del escaneador de libros: las líneas son líneas, y no párrafos que tengas que andar pegando trabajosamente.

Avatar de Usuario
kimkiduk
Mensajes: 1170
Registrado: Jue 27 Ene, 2005 01:00
Ubicación: Lost in La Mancha

Mensaje por kimkiduk » Dom 26 Mar, 2006 22:13

Muy interesantes las herramientas que recomendaís... Ahora mismo estoy sin escáner, pero en cuanto me haga con uno pruebo... gracias

PD: Respecto al objetivo original del hilo, estoy plenamente de acuerdo rubiera, aunque sigo siendo muy fetichista para todo aquello que no sean ensayos, y las novelas me gusta leerlas en formato book :roll:

Avatar de Usuario
rubiera
Mensajes: 343
Registrado: Sab 10 Ene, 2004 01:00
Ubicación: Roma la pagana.

Mensaje por rubiera » Dom 26 Mar, 2006 23:13

Muchísimas gracias por todos los consejos. Ya probaré el programita lo antes posible. Kimkiduk, precisamente quiereo empezar por un ensayo: "La CIA y la guerra fría cultural" de Frances Stonor Saunders.
Espero que no empiecen los histéricos a gritar: rubiera siempre con la política!
Saludos
Imagen

Avatar de Usuario
kimkiduk
Mensajes: 1170
Registrado: Jue 27 Ene, 2005 01:00
Ubicación: Lost in La Mancha

Mensaje por kimkiduk » Dom 26 Mar, 2006 23:29

rubiera escribió:precisamente quiero empezar por un ensayo: "La CIA y la guerra fría cultural" de Frances Stonor Saunders.
Espero que no empiecen los histéricos a gritar: rubiera siempre con la política!
Saludos
Si lo posteas yo gritaré histéricamente "¡Rubiera siempre con la política!", para después bajarlo y leerlo vorazmente. :mrgreen:
En espera quedo :wink:

Avatar de Usuario
Spartakku
Mensajes: 178
Registrado: Jue 27 Ene, 2005 01:00
Ubicación: Chile

Mensaje por Spartakku » Lun 27 Mar, 2006 08:25

Yo llevo unos 6 años "ripeando" libros para internet. Incluso antiguamente tuve una web (el Proyecto Espartaco), que tuvo su momento de gloria, pero que tuve que cerrar por amenazas de demandas de un par de editoriales (Critica y Anagrama).

El tema con los libros es que practicamente no existen sistemas "automáticos" de producción de ebooks. Efectivamente, el mejor programa de OCR es el FineReader, que ya va en su versión 8 (muy buena). Pero no hay absolútamente ningún programa que el OCR te lo arroje totalmente limpio, y si quieres un ebook en, por ejemplo, formato para word (u otros editores de texto), tienes que necesariamente hacer una post corrección por lectura directa de todo el libro, que es el método utilizado en los varios grupos que nos dedicamos a esto.

Otra opción, que es la que usamos en un grupo en que digitalizamos exclusivamente libros de derecho, es hacer los libros en pdf de imagen. Son muchisimo más pesados que un ebook en word, pero nosotros lo preferimos porque, por una parte no se hace necesaria la corrección por lectura, y por otra los libros son exactamente idénticos al original, incluyendo paginado y cosas así, lo que es muy importante cuando escaneas libros técnicos que luego puedes necesitar para estudiar, trabajar, citar en investigaciones, etc. Además, la corrección por lectura en este tipo de libros demanda muchísmo trabajo, debido a su gran extensión, el uso de lenguaje técnico y la gran cantidad de notas a pie de página que es necesario agregar.

Tengo un manual para hacer estos pdf de imagenes, usando el FineReader 8 y el acrobat 7, si te interesa puedo subirlo a la mula o mandártelo a tu correo.

Para una guía sobre como digitalizar para word usando el finereader 7 (aunque también puede valer para el 8 ) puedes ir a la siguientes web (que pertenece a uno de los grupos en que participo): http://biblioteca.d2g.com/biblioteca/tu ... caneo.html

Cualquier duda, estoy a tu disposición, tal vez te pueda colaborar. De hecho, ahora mismo estoy tratando de conseguir el libro de Truffaut "El Cine Según Hitchcock" para digitalizarlo (un amigo tratará de escanearlo y yo lo editaré). Cuando esté listo los pondré en emule y avisaré aquí.

Un saludo.

Spartakku

Avatar de Usuario
rubiera
Mensajes: 343
Registrado: Sab 10 Ene, 2004 01:00
Ubicación: Roma la pagana.

Mensaje por rubiera » Lun 27 Mar, 2006 09:03

Muchas gracias Spartakku por tu respuesta. Pues sí, creo que eres el tipo ideal para pedir consejos. Yo por el momento estoy muy interesado en el manual de que has hablado. Podrías mandármelo por email? También lo podríamos poner en la mula a compartir para todos los interesados.
No quisiera empezar cometiendo errores, sobre todo porque el trabajo de scanning de por sí ya será fatigoso, puesto que lo tengo que hacer en mi trabajo, durante mis largos tiempos nocturnos de espera en el laboratorio. Ah, y el primer libro que pensaba scannear tiene más de 600 páginas.:shock:
Saludos y gracias. :D
Imagen

Avatar de Usuario
alegre
Mensajes: 2228
Registrado: Mié 07 May, 2003 02:00
Ubicación: Valencia

Mensaje por alegre » Lun 27 Mar, 2006 09:55

:D Saludo la idea y a los saludables...

Desde mi ignorancia dos preguntas:
¿la idea que tengo de que para escanear un libro hay que tenerlo hoja a hoja es correcta?

Para leer el formato PDF en la PDA ¿que hay que hacer?
Un saludo

PD Si me resulta factible yo colaboraria con el delicioso ensayo

"LA CRUZADA CONTRA EL CINE 1940-1975" de Gregory D. Black.

Un cuento para niñ@ grandes sobre lo que ayuda a que pensemos como pensamos...(lo del libre albedrio es como lo de las cigüeñas, vamos :mrgreen: )
Los directores que me enseñan a pensar me resultan admirables...
Los que trafican con mi pensamiento vendiendolo al mejor postor, sólo consiguen que desprecie toda su obra...
(Anónimo de principios del Siglo XXI)

Avatar de Usuario
FraNXesco
Mensajes: 183
Registrado: Sab 29 Ene, 2005 01:00
Ubicación: Barna

Mensaje por FraNXesco » Lun 27 Mar, 2006 17:37

Existe otra opción que evita el OCR y es más rápida, se trata de los CGR. Se escanea como imagen la página y se salva como jpg nombrándola por su número, luego cuando las tienes todas las metes en un zip y le cambias la extensión a CBR. Hay un programita gratuito que se llama CDisplay Comic Reader utility (yo uso la version 1.7.4.6) que lee los cbr en formato libro, página a página en tamaño pantalla. Lo utilizan para cómics pero para libros va de cine. La ventaja es que lo escaneado es "limpio" no hay que hacer trabajo secundario, ni rectificar ni pasar correctores, en una sola pasada ya tienes la página lista!!!!... luego a quien le apetezca puede pasar por su cuenta la imagen por el OCR para crear un texto aunque no es necesario para leer el libro.

Nadie lo usa para libros pero ... ¿por qué no?

Saludos

A modo de ejemplo

ed2k linkCahiers du Cinema 608 ed2k link stats

(Saludos especiales a Spartakku, tu página era mágnifica, me alegra verte por aquí)

Avatar de Usuario
locutus
AKA Jean-Luc Picard
Mensajes: 2044
Registrado: Lun 14 Jun, 2004 02:00
Ubicación: Cuadrante Delta

Mensaje por locutus » Mar 28 Mar, 2006 00:21

alegre escribió: Para leer el formato PDF en la PDA ¿que hay que hacer?
[/quote]

Instalar el acrobat para la versión del S.O. que tenga el PDA. Lo malo es que si no es muy grande la pantalla...por lo menos la mía no. :cry:

También está el Microsoft Reader que lee libros en formato LIT, que se adecua más a la PDA... :mrgreen:

Espero que te sirva de ayuda... :roll:

Avatar de Usuario
Spartakku
Mensajes: 178
Registrado: Jue 27 Ene, 2005 01:00
Ubicación: Chile

Mensaje por Spartakku » Mar 28 Mar, 2006 06:07

FraNXesco escribió:Existe otra opción que evita el OCR y es más rápida, se trata de los CGR.
El problema con los CGR es que si no les haces un proceso previo de edición (limpieza de la imágen), ellos quedan bastante poco agradables a la vista. Además, con ellos hay varias herramientas que no puedes usar, que sí te permite el pdf de imagen al cual se le ha hecho OCR: copiar y pegar texto, y buscar dentro del libro. Si no fuera por eso, podría perfectamente hacerse el libro como un archivo multitif y luego leerlo en un programa como el irfanview u otro visor de imágenes.

Repito: en este caso no se hace corrección del libro por lectura, como hacen en otros grupos, ya que ello es innecesario, puesto que cualquier error del ocr se soslaya al tener las imágenes a la vista. Por eso el sistema es mucho más rápido (un libro de unas 300 páginas, debería estar listo, con scan y edición, en no más de 2 a 3 horas como mucho).

Para hacerse una idea de cómo queda un libro usando el sistema que más arriba traté, he puesto un archivo de muestra en el emule, que si quieren pueden descargar:

ed2k linkVarios.Autores.-.Criminologia.Critica.y.Control.Social.1.(El.Poder.Punitivo.del.Estado).pdf ed2k link stats

Y acá les dejo el tutorial de cómo hacerlo. Aunque ojo, el tutorial sólo trata de la edición, una vez que el libro ya ha sido escaneado, es únicamente para ver como armar bien el pdf y que el trabajo quede de la mejor forma posible.

ed2k linkTutorial.de.edicion.para.hacer.libro.en.formato.pdf.de.imagen.pdf ed2k link stats

Ojalá bajen los archivos y luego me dicen qué piensan.

Un saludo

Spartakku

Avatar de Usuario
Valdis
Mensajes: 259
Registrado: Sab 01 Oct, 2005 02:00
Ubicación: Sarcófago

Mensaje por Valdis » Mar 28 Mar, 2006 08:31

Yo he pinchado ambos, Spartakku, porque me interesa mucho poder escanear libros y tenerlos en formato pdf. Muchas gracias por los enlaces :wink:

Bueno, no sólo los acabo de pinchar, sino que ya los tengo descargados, a una velocidad supersónica, pues no ha bajado de 40 kB/s la descarga :shock: Ambos están compartiéndose.

Lo dicho, muchas gracias :plas:

Avatar de Usuario
rubiera
Mensajes: 343
Registrado: Sab 10 Ene, 2004 01:00
Ubicación: Roma la pagana.

Mensaje por rubiera » Mar 28 Mar, 2006 08:36

FraNXesco, yo seguiré tus consejos. Por el momento he pinchado los archivos y me estudiaré bien todo antes de dar el primer paso. Quizás convenga comenzar con un libro de pocas páginas. Ya buscaré algo interesante para el primer escaneo.
Alegre, lo siento no te puedo ayudar porque no he tenido en mis manos nunca una PDA, ni sé que tipo de S.O. tienen. Yo por lo general uso una PC portátil para leer y aunque tiene sus inconvenientes de comodidad no me puedo quejar.
Muchas gracias a todos por los consejos. Saludísimos.
Imagen

Avatar de Usuario
Spartakku
Mensajes: 178
Registrado: Jue 27 Ene, 2005 01:00
Ubicación: Chile

Mensaje por Spartakku » Mar 28 Mar, 2006 08:59

Valdis escribió:Yo he pinchado ambos, Spartakku, porque me interesa mucho poder escanear libros y tenerlos en formato pdf. Muchas gracias por los enlaces :wink:
Que bueno que te bajó rápido Valdis.

Como podrás ver, el libro es una copia fiel y exacta de su original en papel, casi como si de una "fotocopia" virtual se tratara.

En un grupo en que estoy hemos hecho más de 300 libros de Derecho en ese formato, en menos de 8 meses, y eso que no llegamos a los 10 miembros. En mi caso me resultan muy útiles, ya que me dedico a hacer monografías, y por eso necesito acceso a mucha bibliografía. Ahora puedo andar a cuestas con una completa biblioteca, sin necesidad de cargar con un montón de tomos bajo el brazo.

También, si tienes el acrobat completo, podrás ver que además de poder seleccionar texto, también se puede ir destacando las partes que más te interesan, y si el programa está correctamente configurado, luego esas partes destacadas puedes exportarlas, sea para tener un resumen que luego podrás trabajar en word, sea para luego cargar las marcas en otra versión del libro y así siempre contar con una versión limpia, a la que le cargas las marcas sólo cuando las necesitas. Esto, puede llegar a ser muy útil, sobre todo para los estudiantes.

Cualquier duda, estoy a su disposición

Avatar de Usuario
Valdis
Mensajes: 259
Registrado: Sab 01 Oct, 2005 02:00
Ubicación: Sarcófago

Mensaje por Valdis » Mar 28 Mar, 2006 09:25

Spartakku escribió:Que bueno que te bajó rápido Valdis.

Como podrás ver, el libro es una copia fiel y exacta de su original en papel, casi como si de una "fotocopia" virtual se tratara.

En un grupo en que estoy hemos hecho más de 300 libros de Derecho en ese formato, en menos de 8 meses, y eso que no llegamos a los 10 miembros. En mi caso me resultan muy útiles, ya que me dedico a hacer monografías, y por eso necesito acceso a mucha bibliografía. Ahora puedo andar a cuestas con una completa biblioteca, sin necesidad de cargar con un montón de tomos bajo el brazo.

También, si tienes el acrobat completo, podrás ver que además de poder seleccionar texto, también se puede ir destacando las partes que más te interesan, y si el programa está correctamente configurado, luego esas partes destacadas puedes exportarlas, sea para tener un resumen que luego podrás trabajar en word, sea para luego cargar las marcas en otra versión del libro y así siempre contar con una versión limpia, a la que le cargas las marcas sólo cuando las necesitas. Esto, puede llegar a ser muy útil, sobre todo para los estudiantes.

Cualquier duda, estoy a su disposición
Pues sí, es exactamente como si fuera una fotocopia digital.

Le he echado también un vistazo al tutorial y me va a venir fenomenal, porque estoy haciendo la tesis y también necesito manejar muchos libros. Tenerlos en formato pdf va a ser una extraordinaria ventaja a la hora de archivar la información y, sobre todo, de transportarla.

Si tengo alguna duda en el procedimiento, ya la plantearé por aquí, aunque no lo creo, porque el tutorial es meridianamente claro.

Muchísimas gracias por todo, Spartakku :wink:

Avatar de Usuario
rubiera
Mensajes: 343
Registrado: Sab 10 Ene, 2004 01:00
Ubicación: Roma la pagana.

Mensaje por rubiera » Vie 31 Mar, 2006 08:19

Valdis escribió:
Spartakku escribió:Que bueno que te bajó rápido Valdis.

Como podrás ver, el libro es una copia fiel y exacta de su original en papel, casi como si de una "fotocopia" virtual se tratara.

En un grupo en que estoy hemos hecho más de 300 libros de Derecho en ese formato, en menos de 8 meses, y eso que no llegamos a los 10 miembros. En mi caso me resultan muy útiles, ya que me dedico a hacer monografías, y por eso necesito acceso a mucha bibliografía. Ahora puedo andar a cuestas con una completa biblioteca, sin necesidad de cargar con un montón de tomos bajo el brazo.

También, si tienes el acrobat completo, podrás ver que además de poder seleccionar texto, también se puede ir destacando las partes que más te interesan, y si el programa está correctamente configurado, luego esas partes destacadas puedes exportarlas, sea para tener un resumen que luego podrás trabajar en word, sea para luego cargar las marcas en otra versión del libro y así siempre contar con una versión limpia, a la que le cargas las marcas sólo cuando las necesitas. Esto, puede llegar a ser muy útil, sobre todo para los estudiantes.

Cualquier duda, estoy a su disposición
Pues sí, es exactamente como si fuera una fotocopia digital.
Yo tengo una duda a partir de un problema: durante el escaneo, sobre todo si el libro tiene muchas páginas, resulta imposible dejar márgenes en la zona que está más cerca del lomo del libro y por lo tanto este borde, que está curvado y no plano, resulta deformado. Esto es un problema porque el OCR no lo reconoce bien, lo que hace que tendría que editar página a página a mano.
No se me ocurre otra solución que desencuadernar el libro y escanear las páginas por separado, lo cuál sería realmente una lástima. Existe otra manera de resolver este problema que no sea de esta forma tan brutal? :?
Gracias
Imagen

Avatar de Usuario
rubiera
Mensajes: 343
Registrado: Sab 10 Ene, 2004 01:00
Ubicación: Roma la pagana.

Mensaje por rubiera » Lun 03 Abr, 2006 20:00

rubiera escribió: Yo tengo una duda a partir de un problema: durante el escaneo, sobre todo si el libro tiene muchas páginas, resulta imposible dejar márgenes en la zona que está más cerca del lomo del libro y por lo tanto este borde, que está curvado y no plano, resulta deformado. Esto es un problema porque el OCR no lo reconoce bien, lo que hace que tendría que editar página a página a mano.
No se me ocurre otra solución que desencuadernar el libro y escanear las páginas por separado, lo cuál sería realmente una lástima. Existe otra manera de resolver este problema que no sea de esta forma tan brutal? :?
Gracias
Me cito para insistir en la pregunta, visto que no he recibido respuesta.
Imagen

Avatar de Usuario
maskao
Mensajes: 91
Registrado: Sab 13 Dic, 2003 01:00
Ubicación: lo más lejos, a mi lado

Mensaje por maskao » Sab 13 May, 2006 15:50

Hola buenas gentes.
Vereis, me he puesto a escanear un librejo que necesito, pero tengo un pequeño problemilla. El papel en el que está impreso es muy fino y al escanear una me aparecen en la página las letras de la cara de atrás junto con las de alante (sobre todo si son negritas).

¿Sabeis si con alguno de los parámetros que traen los escaneres para ajustar podría evitarlo?
"Y mi alma, de esa sombra que allí flota fantasmal, no se alzará... nunca más"

manuela
Mensajes: 939
Registrado: Jue 16 Sep, 2004 02:00
Ubicación: Frente al mar

Mensaje por manuela » Dom 14 May, 2006 11:17

Voy a bajarme el tutorial de cómo ripear libros en formato pdf.
"La armonía interior es mejor que la evidente" Heráclito

Responder