Ripeos de libros
Hay varios métodos que puedes probar.maskao escribió:Hola buenas gentes.
Vereis, me he puesto a escanear un librejo que necesito, pero tengo un pequeño problemilla. El papel en el que está impreso es muy fino y al escanear una me aparecen en la página las letras de la cara de atrás junto con las de alante (sobre todo si son negritas).
¿Sabeis si con alguno de los parámetros que traen los escaneres para ajustar podría evitarlo?
1º graduar bien la relación entre brillo y contraste, aclarando la imagen de salida hasta que ya no se noten las sombras de lo que está atras. Esto, claro, tiene la limitación que al aclarar mucho puede llegar a un punto en que las letras de la página que escaneas ya no se vean muy nítidas, por eso es bueno ir probando y puede ser necesario incluso que los parámetros cambien entre distintas hojas.
2º El FineReader trae una herramienta que en ingles se llama "despeckle image" (no se cual sera su nombre en la versión en español). Eso te permite automáticamente borrar suciedad del texto. No obstante, no siempre lo borra todo, y en ocasiones puede llegar a borrarle los puntos a las letras "i". Pero tal vez combinado con el método de arriba te puede dar un buen resultado.
3º La mayoría de los scanners traen una herramienta que se llama descreen (en español puede llamarse destramado o algo parecido). Ella cumple la funcion de eliminar el tramado de las hojas, por ejemplo cuando escaneas una foto de una revista. Pero tabién puede usarse para eliminar las marcas de la página de atrás de un texto en el caso de los diarios. Eso si, el scan en este caso sería muchísimo más lento.
Espero que alguno de estos tips te sean de utilidad.
Un saludo
Gracias por tus consejos Spartakku.
Al final, probando he conseguido algo más o menos decente con la herramienta borrador del finereader (aunque es basante pesado) porque lo del destramado me hacia perder mucha nitidez.
La opción "despeckle image" tambien me ha venido bastante bien, sobre todo para algunas zonas. Por cierto en castellano es "limpiar imagen".
Respecto a ajustar brillo-contraste la verdad es que no he experimentado mucho con ello. La próxima vez
Al final, probando he conseguido algo más o menos decente con la herramienta borrador del finereader (aunque es basante pesado) porque lo del destramado me hacia perder mucha nitidez.
La opción "despeckle image" tambien me ha venido bastante bien, sobre todo para algunas zonas. Por cierto en castellano es "limpiar imagen".
Respecto a ajustar brillo-contraste la verdad es que no he experimentado mucho con ello. La próxima vez
"Y mi alma, de esa sombra que allí flota fantasmal, no se alzará... nunca más"
Para usar la herramienta de borrado del FineReader lo mejor es poner la visualización de la imagen a un 300 o 400%, así resulta más fácil ir quitando, sobre todo los subrayados.
Ahora, cuando lo que hay que borrar es demasiado, resulta mejor exportar las imágenes y hacerlo desde algún editor como Photoshop. Yo uso el Fireworks, que es el editor que mejor manejo desde los tiempos en que me daba por hacer páginas web, es bastante cómodo, el problema con él es que hay que previamente convertir las imágenes a png, porque no soporta los tiff fax 4, y una vez acabado, volver a convertuir a tif. Aunque eso no es problema, ya que el Irfanview lo hace automático y se demora nada.
Eso si, nunca, pero nunca, conviertas las imágenes a jpg, porque ahi las imágenes en blanco y negro pierden un montón de calidad, particularmente nitidez.
Un saludo
Ahora, cuando lo que hay que borrar es demasiado, resulta mejor exportar las imágenes y hacerlo desde algún editor como Photoshop. Yo uso el Fireworks, que es el editor que mejor manejo desde los tiempos en que me daba por hacer páginas web, es bastante cómodo, el problema con él es que hay que previamente convertir las imágenes a png, porque no soporta los tiff fax 4, y una vez acabado, volver a convertuir a tif. Aunque eso no es problema, ya que el Irfanview lo hace automático y se demora nada.
Eso si, nunca, pero nunca, conviertas las imágenes a jpg, porque ahi las imágenes en blanco y negro pierden un montón de calidad, particularmente nitidez.
Un saludo
Si jeje eso lo comprobé en propias carnes gracias a unos escaneos que me pasó un amigo y que eran una auténtica caquita por haberlos hecho en ese formato.Spartakku escribió:Eso si, nunca, pero nunca, conviertas las imágenes a jpg, porque ahi las imágenes en blanco y negro pierden un montón de calidad, particularmente nitidez
"Y mi alma, de esa sombra que allí flota fantasmal, no se alzará... nunca más"
- Nueve Maletas
- Mensajes: 455
- Registrado: Dom 11 Jun, 2006 09:49
Aunque ya han pasado unas cuantas semanas desde que tuvo lugar el debate sobre el escaneado de libros, pero dado que es un tema que me interesa en especial, quería añadir algunos comentarios. Por si alguien se anima a comentarlos
Durante estas últimas semanas he usado una cámara digital de fotos como alternativa al tradicional escáner y la velocidad y comodidad que se gana es realmente espectacular. La digitalización es poco menos que instantánea; el escáner, por el contrario, me tardaba unos 15 segundos por página, más o menos. También nos ahorra la incomodidad del hecho de tener que dar la vuelta al libro y ponerlo boca abajo cada vez.
El inconveniente que le veo es la resolución de las cámaras (la mía tiene 4 megapíxeles) que da como resultado una imagen un pelín menos nítida que la obtenida mediante el escáner (aunque las últimas cámaras salidas al mercado están mejorando en mucho su potencia).
Por otra parte, el programa FineReader es el mejor software para el tratamiento OCR que, no obstante, sigue exigiendo bastante paciencia para ciertos libros.
Y para las ocasiones en las que no queremos o no se puede convertir el texto en OCR (por ejemplo, cuando el texto original está escrito a mano o con fuentes caligráficas) pensé inicialmente en pasar sin más las imágenes JPG al formato PDF pero me da la impresión que pierden algo de calidad, de manera que no sé...
Desde luego, a diferencia de lo que sucede con los audiovisuales cuando los pasamos a formato digital que nos dan unos resultados satisfactorios (en general), el texto escrito está todavía en una fase menos desarrollada. No hay más que ver los diferentes proyectos de las instituciones públicas dedicadas a la digitalización de libros, revistas y periódicos, como cada una utiliza unos procedimientos y unas aplicaciones muy específicos y nada o poco consensuados. Queda mucho camino por recorrer.
Salut
Durante estas últimas semanas he usado una cámara digital de fotos como alternativa al tradicional escáner y la velocidad y comodidad que se gana es realmente espectacular. La digitalización es poco menos que instantánea; el escáner, por el contrario, me tardaba unos 15 segundos por página, más o menos. También nos ahorra la incomodidad del hecho de tener que dar la vuelta al libro y ponerlo boca abajo cada vez.
El inconveniente que le veo es la resolución de las cámaras (la mía tiene 4 megapíxeles) que da como resultado una imagen un pelín menos nítida que la obtenida mediante el escáner (aunque las últimas cámaras salidas al mercado están mejorando en mucho su potencia).
Por otra parte, el programa FineReader es el mejor software para el tratamiento OCR que, no obstante, sigue exigiendo bastante paciencia para ciertos libros.
Y para las ocasiones en las que no queremos o no se puede convertir el texto en OCR (por ejemplo, cuando el texto original está escrito a mano o con fuentes caligráficas) pensé inicialmente en pasar sin más las imágenes JPG al formato PDF pero me da la impresión que pierden algo de calidad, de manera que no sé...
Desde luego, a diferencia de lo que sucede con los audiovisuales cuando los pasamos a formato digital que nos dan unos resultados satisfactorios (en general), el texto escrito está todavía en una fase menos desarrollada. No hay más que ver los diferentes proyectos de las instituciones públicas dedicadas a la digitalización de libros, revistas y periódicos, como cada una utiliza unos procedimientos y unas aplicaciones muy específicos y nada o poco consensuados. Queda mucho camino por recorrer.
Salut
Descargas de libros
Recupero este hilo antiguo por si a alguien le puede interesar descargarse esta biblioteca. Es el famoso FTPMichel que en su día alojó en:
http://ftpmichel.bitacoras.com/
Es un torrent de 1,8 gigas con 7000 libros:
http://torrents.thepiratebay.org/341454 ... PB.torrent
Algunas bibliotecas virtuales de descarga directa de libros:
http://www.bibliotheka.org/
http://federigo.net/index01.htm
http://www.librodot.com/
http://www.gutenberg.org/wiki/Main_Page
Saludos
http://ftpmichel.bitacoras.com/
Es un torrent de 1,8 gigas con 7000 libros:
http://torrents.thepiratebay.org/341454 ... PB.torrent
Algunas bibliotecas virtuales de descarga directa de libros:
http://www.bibliotheka.org/
http://federigo.net/index01.htm
http://www.librodot.com/
http://www.gutenberg.org/wiki/Main_Page
Saludos
Re: Ripeos de libros
Conoceis a dia de hoy alguna página de descarga de libros en Castellano? Mi hermana es una ávida lectora y le han regalado por su cumple un ebook, Y bueno me gustaría poderle regalarle libros en pdf.
saludos y Gracias
saludos y Gracias
No te dejes
Arriba los pobres de Honduras
Arriba los pobres de Honduras
- Spanish Jhonny
- Mensajes: 3678
- Registrado: Mar 18 Sep, 2012 16:01
Re: Ripeos de libros
La burra te guiará sin problemas, busca y encontrarás
Saludos
Re: Ripeos de libros
Lectulandia. Pero tienes que entrar con VPN (con ip de Asia no da problemas) porque la chaparon hace unas semanas los jueses. Evidentemente sigue donde estaba y siguen subiendo libros
Si tu mula necesita un empujón avísame y te pongo slot
Re: Ripeos de libros
Actualmente más de 42.000 libros, para leer durante 42.000 años. También hay de cine.
En formato Epub, si tiene un Kindle no le sirve, pero con el programa Calibre puede convertirlos a formato .mobi que sí lee el Kindle. Otros e-readers sí leen Epub.
Descarga por torrent.
- Spoiler: mostrar
Re: Ripeos de libros
Muchas gracias por vestras respuestas!
No te dejes
Arriba los pobres de Honduras
Arriba los pobres de Honduras