Ripeos de libros
Ripeos de libros
Por qué no hacer copias de libros y compartirlas? Tengo varios libros que seguramente nunca han sido ni serán editados en Europa y me gustaría compartirlos y sacarlos un poco a la luz.
Por el momento se me ocurre escanearlos, pasarlos a formato pdf y meterlos en la mula a compartir. Si alguien tiene trucos, maneras y formas de hacer este trabajo lo más fácil posible agradecería sus consejos.
Saludos.
Por el momento se me ocurre escanearlos, pasarlos a formato pdf y meterlos en la mula a compartir. Si alguien tiene trucos, maneras y formas de hacer este trabajo lo más fácil posible agradecería sus consejos.
Saludos.
- Teeninlove
- Mensajes: 1582
- Registrado: Dom 25 Jul, 2004 02:00
- Wladimirito
- Mensajes: 294
- Registrado: Jue 27 Ene, 2005 01:00
- Ubicación: Llamémosle Vasconia...
Muy interesantes las herramientas que recomendaís... Ahora mismo estoy sin escáner, pero en cuanto me haga con uno pruebo... gracias
PD: Respecto al objetivo original del hilo, estoy plenamente de acuerdo rubiera, aunque sigo siendo muy fetichista para todo aquello que no sean ensayos, y las novelas me gusta leerlas en formato book
PD: Respecto al objetivo original del hilo, estoy plenamente de acuerdo rubiera, aunque sigo siendo muy fetichista para todo aquello que no sean ensayos, y las novelas me gusta leerlas en formato book
Si lo posteas yo gritaré histéricamente "¡Rubiera siempre con la política!", para después bajarlo y leerlo vorazmente.rubiera escribió:precisamente quiero empezar por un ensayo: "La CIA y la guerra fría cultural" de Frances Stonor Saunders.
Espero que no empiecen los histéricos a gritar: rubiera siempre con la política!
Saludos
En espera quedo
Yo llevo unos 6 años "ripeando" libros para internet. Incluso antiguamente tuve una web (el Proyecto Espartaco), que tuvo su momento de gloria, pero que tuve que cerrar por amenazas de demandas de un par de editoriales (Critica y Anagrama).
El tema con los libros es que practicamente no existen sistemas "automáticos" de producción de ebooks. Efectivamente, el mejor programa de OCR es el FineReader, que ya va en su versión 8 (muy buena). Pero no hay absolútamente ningún programa que el OCR te lo arroje totalmente limpio, y si quieres un ebook en, por ejemplo, formato para word (u otros editores de texto), tienes que necesariamente hacer una post corrección por lectura directa de todo el libro, que es el método utilizado en los varios grupos que nos dedicamos a esto.
Otra opción, que es la que usamos en un grupo en que digitalizamos exclusivamente libros de derecho, es hacer los libros en pdf de imagen. Son muchisimo más pesados que un ebook en word, pero nosotros lo preferimos porque, por una parte no se hace necesaria la corrección por lectura, y por otra los libros son exactamente idénticos al original, incluyendo paginado y cosas así, lo que es muy importante cuando escaneas libros técnicos que luego puedes necesitar para estudiar, trabajar, citar en investigaciones, etc. Además, la corrección por lectura en este tipo de libros demanda muchísmo trabajo, debido a su gran extensión, el uso de lenguaje técnico y la gran cantidad de notas a pie de página que es necesario agregar.
Tengo un manual para hacer estos pdf de imagenes, usando el FineReader 8 y el acrobat 7, si te interesa puedo subirlo a la mula o mandártelo a tu correo.
Para una guía sobre como digitalizar para word usando el finereader 7 (aunque también puede valer para el 8 ) puedes ir a la siguientes web (que pertenece a uno de los grupos en que participo): http://biblioteca.d2g.com/biblioteca/tu ... caneo.html
Cualquier duda, estoy a tu disposición, tal vez te pueda colaborar. De hecho, ahora mismo estoy tratando de conseguir el libro de Truffaut "El Cine Según Hitchcock" para digitalizarlo (un amigo tratará de escanearlo y yo lo editaré). Cuando esté listo los pondré en emule y avisaré aquí.
Un saludo.
Spartakku
El tema con los libros es que practicamente no existen sistemas "automáticos" de producción de ebooks. Efectivamente, el mejor programa de OCR es el FineReader, que ya va en su versión 8 (muy buena). Pero no hay absolútamente ningún programa que el OCR te lo arroje totalmente limpio, y si quieres un ebook en, por ejemplo, formato para word (u otros editores de texto), tienes que necesariamente hacer una post corrección por lectura directa de todo el libro, que es el método utilizado en los varios grupos que nos dedicamos a esto.
Otra opción, que es la que usamos en un grupo en que digitalizamos exclusivamente libros de derecho, es hacer los libros en pdf de imagen. Son muchisimo más pesados que un ebook en word, pero nosotros lo preferimos porque, por una parte no se hace necesaria la corrección por lectura, y por otra los libros son exactamente idénticos al original, incluyendo paginado y cosas así, lo que es muy importante cuando escaneas libros técnicos que luego puedes necesitar para estudiar, trabajar, citar en investigaciones, etc. Además, la corrección por lectura en este tipo de libros demanda muchísmo trabajo, debido a su gran extensión, el uso de lenguaje técnico y la gran cantidad de notas a pie de página que es necesario agregar.
Tengo un manual para hacer estos pdf de imagenes, usando el FineReader 8 y el acrobat 7, si te interesa puedo subirlo a la mula o mandártelo a tu correo.
Para una guía sobre como digitalizar para word usando el finereader 7 (aunque también puede valer para el 8 ) puedes ir a la siguientes web (que pertenece a uno de los grupos en que participo): http://biblioteca.d2g.com/biblioteca/tu ... caneo.html
Cualquier duda, estoy a tu disposición, tal vez te pueda colaborar. De hecho, ahora mismo estoy tratando de conseguir el libro de Truffaut "El Cine Según Hitchcock" para digitalizarlo (un amigo tratará de escanearlo y yo lo editaré). Cuando esté listo los pondré en emule y avisaré aquí.
Un saludo.
Spartakku
Muchas gracias Spartakku por tu respuesta. Pues sí, creo que eres el tipo ideal para pedir consejos. Yo por el momento estoy muy interesado en el manual de que has hablado. Podrías mandármelo por email? También lo podríamos poner en la mula a compartir para todos los interesados.
No quisiera empezar cometiendo errores, sobre todo porque el trabajo de scanning de por sí ya será fatigoso, puesto que lo tengo que hacer en mi trabajo, durante mis largos tiempos nocturnos de espera en el laboratorio. Ah, y el primer libro que pensaba scannear tiene más de 600 páginas.
Saludos y gracias.
No quisiera empezar cometiendo errores, sobre todo porque el trabajo de scanning de por sí ya será fatigoso, puesto que lo tengo que hacer en mi trabajo, durante mis largos tiempos nocturnos de espera en el laboratorio. Ah, y el primer libro que pensaba scannear tiene más de 600 páginas.
Saludos y gracias.
Saludo la idea y a los saludables...
Desde mi ignorancia dos preguntas:
PD Si me resulta factible yo colaboraria con el delicioso ensayo
"LA CRUZADA CONTRA EL CINE 1940-1975" de Gregory D. Black.
Un cuento para niñ@ grandes sobre lo que ayuda a que pensemos como pensamos...(lo del libre albedrio es como lo de las cigüeñas, vamos )
Desde mi ignorancia dos preguntas:
Un saludo¿la idea que tengo de que para escanear un libro hay que tenerlo hoja a hoja es correcta?
Para leer el formato PDF en la PDA ¿que hay que hacer?
PD Si me resulta factible yo colaboraria con el delicioso ensayo
"LA CRUZADA CONTRA EL CINE 1940-1975" de Gregory D. Black.
Un cuento para niñ@ grandes sobre lo que ayuda a que pensemos como pensamos...(lo del libre albedrio es como lo de las cigüeñas, vamos )
Los directores que me enseñan a pensar me resultan admirables...
Los que trafican con mi pensamiento vendiendolo al mejor postor, sólo consiguen que desprecie toda su obra...
(Anónimo de principios del Siglo XXI)
Los que trafican con mi pensamiento vendiendolo al mejor postor, sólo consiguen que desprecie toda su obra...
(Anónimo de principios del Siglo XXI)
Existe otra opción que evita el OCR y es más rápida, se trata de los CGR. Se escanea como imagen la página y se salva como jpg nombrándola por su número, luego cuando las tienes todas las metes en un zip y le cambias la extensión a CBR. Hay un programita gratuito que se llama CDisplay Comic Reader utility (yo uso la version 1.7.4.6) que lee los cbr en formato libro, página a página en tamaño pantalla. Lo utilizan para cómics pero para libros va de cine. La ventaja es que lo escaneado es "limpio" no hay que hacer trabajo secundario, ni rectificar ni pasar correctores, en una sola pasada ya tienes la página lista!!!!... luego a quien le apetezca puede pasar por su cuenta la imagen por el OCR para crear un texto aunque no es necesario para leer el libro.
Nadie lo usa para libros pero ... ¿por qué no?
Saludos
A modo de ejemplo
Cahiers du Cinema 608
(Saludos especiales a Spartakku, tu página era mágnifica, me alegra verte por aquí)
Nadie lo usa para libros pero ... ¿por qué no?
Saludos
A modo de ejemplo
Cahiers du Cinema 608
(Saludos especiales a Spartakku, tu página era mágnifica, me alegra verte por aquí)
- locutus
- AKA Jean-Luc Picard
- Mensajes: 2044
- Registrado: Lun 14 Jun, 2004 02:00
- Ubicación: Cuadrante Delta
[/quote]alegre escribió: Para leer el formato PDF en la PDA ¿que hay que hacer?
Instalar el acrobat para la versión del S.O. que tenga el PDA. Lo malo es que si no es muy grande la pantalla...por lo menos la mía no.
También está el Microsoft Reader que lee libros en formato LIT, que se adecua más a la PDA...
Espero que te sirva de ayuda...
El problema con los CGR es que si no les haces un proceso previo de edición (limpieza de la imágen), ellos quedan bastante poco agradables a la vista. Además, con ellos hay varias herramientas que no puedes usar, que sí te permite el pdf de imagen al cual se le ha hecho OCR: copiar y pegar texto, y buscar dentro del libro. Si no fuera por eso, podría perfectamente hacerse el libro como un archivo multitif y luego leerlo en un programa como el irfanview u otro visor de imágenes.FraNXesco escribió:Existe otra opción que evita el OCR y es más rápida, se trata de los CGR.
Repito: en este caso no se hace corrección del libro por lectura, como hacen en otros grupos, ya que ello es innecesario, puesto que cualquier error del ocr se soslaya al tener las imágenes a la vista. Por eso el sistema es mucho más rápido (un libro de unas 300 páginas, debería estar listo, con scan y edición, en no más de 2 a 3 horas como mucho).
Para hacerse una idea de cómo queda un libro usando el sistema que más arriba traté, he puesto un archivo de muestra en el emule, que si quieren pueden descargar:
Varios.Autores.-.Criminologia.Critica.y.Control.Social.1.(El.Poder.Punitivo.del.Estado).pdf
Y acá les dejo el tutorial de cómo hacerlo. Aunque ojo, el tutorial sólo trata de la edición, una vez que el libro ya ha sido escaneado, es únicamente para ver como armar bien el pdf y que el trabajo quede de la mejor forma posible.
Tutorial.de.edicion.para.hacer.libro.en.formato.pdf.de.imagen.pdf
Ojalá bajen los archivos y luego me dicen qué piensan.
Un saludo
Spartakku
Yo he pinchado ambos, Spartakku, porque me interesa mucho poder escanear libros y tenerlos en formato pdf. Muchas gracias por los enlaces
Bueno, no sólo los acabo de pinchar, sino que ya los tengo descargados, a una velocidad supersónica, pues no ha bajado de 40 kB/s la descarga Ambos están compartiéndose.
Lo dicho, muchas gracias
Bueno, no sólo los acabo de pinchar, sino que ya los tengo descargados, a una velocidad supersónica, pues no ha bajado de 40 kB/s la descarga Ambos están compartiéndose.
Lo dicho, muchas gracias
FraNXesco, yo seguiré tus consejos. Por el momento he pinchado los archivos y me estudiaré bien todo antes de dar el primer paso. Quizás convenga comenzar con un libro de pocas páginas. Ya buscaré algo interesante para el primer escaneo.
Alegre, lo siento no te puedo ayudar porque no he tenido en mis manos nunca una PDA, ni sé que tipo de S.O. tienen. Yo por lo general uso una PC portátil para leer y aunque tiene sus inconvenientes de comodidad no me puedo quejar.
Muchas gracias a todos por los consejos. Saludísimos.
Alegre, lo siento no te puedo ayudar porque no he tenido en mis manos nunca una PDA, ni sé que tipo de S.O. tienen. Yo por lo general uso una PC portátil para leer y aunque tiene sus inconvenientes de comodidad no me puedo quejar.
Muchas gracias a todos por los consejos. Saludísimos.
Que bueno que te bajó rápido Valdis.Valdis escribió:Yo he pinchado ambos, Spartakku, porque me interesa mucho poder escanear libros y tenerlos en formato pdf. Muchas gracias por los enlaces
Como podrás ver, el libro es una copia fiel y exacta de su original en papel, casi como si de una "fotocopia" virtual se tratara.
En un grupo en que estoy hemos hecho más de 300 libros de Derecho en ese formato, en menos de 8 meses, y eso que no llegamos a los 10 miembros. En mi caso me resultan muy útiles, ya que me dedico a hacer monografías, y por eso necesito acceso a mucha bibliografía. Ahora puedo andar a cuestas con una completa biblioteca, sin necesidad de cargar con un montón de tomos bajo el brazo.
También, si tienes el acrobat completo, podrás ver que además de poder seleccionar texto, también se puede ir destacando las partes que más te interesan, y si el programa está correctamente configurado, luego esas partes destacadas puedes exportarlas, sea para tener un resumen que luego podrás trabajar en word, sea para luego cargar las marcas en otra versión del libro y así siempre contar con una versión limpia, a la que le cargas las marcas sólo cuando las necesitas. Esto, puede llegar a ser muy útil, sobre todo para los estudiantes.
Cualquier duda, estoy a su disposición
Pues sí, es exactamente como si fuera una fotocopia digital.Spartakku escribió:Que bueno que te bajó rápido Valdis.
Como podrás ver, el libro es una copia fiel y exacta de su original en papel, casi como si de una "fotocopia" virtual se tratara.
En un grupo en que estoy hemos hecho más de 300 libros de Derecho en ese formato, en menos de 8 meses, y eso que no llegamos a los 10 miembros. En mi caso me resultan muy útiles, ya que me dedico a hacer monografías, y por eso necesito acceso a mucha bibliografía. Ahora puedo andar a cuestas con una completa biblioteca, sin necesidad de cargar con un montón de tomos bajo el brazo.
También, si tienes el acrobat completo, podrás ver que además de poder seleccionar texto, también se puede ir destacando las partes que más te interesan, y si el programa está correctamente configurado, luego esas partes destacadas puedes exportarlas, sea para tener un resumen que luego podrás trabajar en word, sea para luego cargar las marcas en otra versión del libro y así siempre contar con una versión limpia, a la que le cargas las marcas sólo cuando las necesitas. Esto, puede llegar a ser muy útil, sobre todo para los estudiantes.
Cualquier duda, estoy a su disposición
Le he echado también un vistazo al tutorial y me va a venir fenomenal, porque estoy haciendo la tesis y también necesito manejar muchos libros. Tenerlos en formato pdf va a ser una extraordinaria ventaja a la hora de archivar la información y, sobre todo, de transportarla.
Si tengo alguna duda en el procedimiento, ya la plantearé por aquí, aunque no lo creo, porque el tutorial es meridianamente claro.
Muchísimas gracias por todo, Spartakku
Yo tengo una duda a partir de un problema: durante el escaneo, sobre todo si el libro tiene muchas páginas, resulta imposible dejar márgenes en la zona que está más cerca del lomo del libro y por lo tanto este borde, que está curvado y no plano, resulta deformado. Esto es un problema porque el OCR no lo reconoce bien, lo que hace que tendría que editar página a página a mano.Valdis escribió:Pues sí, es exactamente como si fuera una fotocopia digital.Spartakku escribió:Que bueno que te bajó rápido Valdis.
Como podrás ver, el libro es una copia fiel y exacta de su original en papel, casi como si de una "fotocopia" virtual se tratara.
En un grupo en que estoy hemos hecho más de 300 libros de Derecho en ese formato, en menos de 8 meses, y eso que no llegamos a los 10 miembros. En mi caso me resultan muy útiles, ya que me dedico a hacer monografías, y por eso necesito acceso a mucha bibliografía. Ahora puedo andar a cuestas con una completa biblioteca, sin necesidad de cargar con un montón de tomos bajo el brazo.
También, si tienes el acrobat completo, podrás ver que además de poder seleccionar texto, también se puede ir destacando las partes que más te interesan, y si el programa está correctamente configurado, luego esas partes destacadas puedes exportarlas, sea para tener un resumen que luego podrás trabajar en word, sea para luego cargar las marcas en otra versión del libro y así siempre contar con una versión limpia, a la que le cargas las marcas sólo cuando las necesitas. Esto, puede llegar a ser muy útil, sobre todo para los estudiantes.
Cualquier duda, estoy a su disposición
No se me ocurre otra solución que desencuadernar el libro y escanear las páginas por separado, lo cuál sería realmente una lástima. Existe otra manera de resolver este problema que no sea de esta forma tan brutal?
Gracias
Me cito para insistir en la pregunta, visto que no he recibido respuesta.rubiera escribió: Yo tengo una duda a partir de un problema: durante el escaneo, sobre todo si el libro tiene muchas páginas, resulta imposible dejar márgenes en la zona que está más cerca del lomo del libro y por lo tanto este borde, que está curvado y no plano, resulta deformado. Esto es un problema porque el OCR no lo reconoce bien, lo que hace que tendría que editar página a página a mano.
No se me ocurre otra solución que desencuadernar el libro y escanear las páginas por separado, lo cuál sería realmente una lástima. Existe otra manera de resolver este problema que no sea de esta forma tan brutal?
Gracias
Hola buenas gentes.
Vereis, me he puesto a escanear un librejo que necesito, pero tengo un pequeño problemilla. El papel en el que está impreso es muy fino y al escanear una me aparecen en la página las letras de la cara de atrás junto con las de alante (sobre todo si son negritas).
¿Sabeis si con alguno de los parámetros que traen los escaneres para ajustar podría evitarlo?
Vereis, me he puesto a escanear un librejo que necesito, pero tengo un pequeño problemilla. El papel en el que está impreso es muy fino y al escanear una me aparecen en la página las letras de la cara de atrás junto con las de alante (sobre todo si son negritas).
¿Sabeis si con alguno de los parámetros que traen los escaneres para ajustar podría evitarlo?
"Y mi alma, de esa sombra que allí flota fantasmal, no se alzará... nunca más"