De alguna manera habrá que purgar ese fichero
Me pregunto yo si las purgas basadas en el string ED2K no descartan otros enlaces, no acabo de entender y perdona mi ignorancia si esa "paja" que aparece son o no enlaces E2DK o es que se cuelan otros enlaces. Creo entender que salen todos los enlaces ED2K pero como es obvio uno será de la VO de CHina Syndrome y otro el del manual de Torpedorr YDM y eso es lo que hay que purgar.
También habría que extraer de los 2600 títulos los posteados repetidas veces en sitios distintos: hash repetido, aunque esto se puede automatizar fácilmente
El postprocesado comparando hash no es preocupante como bien dices
Aparte de que no están ordenados y que en una pagina estática la búsqueda la puede suplir el Ctrl-F, pero la ordenación no hay manera
No es preocupante tengo un programa en VB que ordena elinks, puedo procesar el fichero sin problemas.
Digamos que estos serían los inconvenientes de generar una página estática con todos lo elinks hallados
La unica dificultad es reformatear los enlaces a HTML.
Pero puede ser el punto final de mi aportación: el fichero html plano o el txt de elinks sin más historia, o directamente nos olvidamos, lo que digáis esto solo es pensar en voz alta.
EL objetivo de esto es generar listas de elinks. El que sean HTML es por comodidad para hacer click click y descargar sin tener que copiar el enlace y meterlo en la mula. Es sólo algo accesorio.
Ese fichero TXT ya es muy valioso de por si, de hecho unoqueva se ha pulido una lista de elinks que partían de un formato no HTML. Se ha `pulido 600 elinks en tarde y media
Ahora bien si vais a meterle mano al listado de elinks y completar esa información con extras y realizar el purgado que digo esto se puede convertir en una tarea titánica
Ciertamente pero no es tan titánica como aparenta creeme. Pero es tediosa, si
y seguiréis teniendo una página web estática: por eso digo que mejor reconducir lo obtenido a una nueva tabla de la base de datos, complementarla y luego generar páginas dinámicamente (ya tenemos el servidor mySql y PHP, pues aprovecharlos)
No soy programador PHP ni MySQL soy un vulgar "tweaker"

necesito un esqueleto para moldear el cuerpo entero. Y el PHP me da igual, pero con la SQL tengo mucho cuidado, ya sabes que es facil generar agujeros de seguridad en ella cuando está mal programada una tabla.
Es por esto que PHP sin problema pero aquello que conlleve operaciones SQL lo descarto si no está probado y reprobado y por lo que me decanto por listas y páginas estáticas a no ser que haya algún script bajo tratamiento devel y seguimiento, con buglists, y todo eso.
Aun asi si me proporcionáis algo estoy dispuesto a probarlo.
Yo de momento no tengo ni idea de phpNuke, pero PHP lo miré y se parece a ASP o JSP, y no creo que sea problema. Si alguien ya tiene experiencia, miel sobre hojuelas. Si me podéis mandar un ejemplo podría instalar apache y php en mi máquina, y jugar con él, hacer alguna prueba (a estas alturas os podéis imaginar que es un proyecto que si sale tardará)
Que duda cabe de lo que planteas es lo ideal. yo no puedo ayudar en esa faceta, pero vamos se trata de coger algo hecho y reformatearlo. PHP es facil de modificar y phpnuke no lia mucho la madeja para leer módulos.
Antes de ese módulo final habría que crear uno temporal donde se haría el pertinente lavado de cara a la lista de elinks. Algo así como: éste elink no procede, a éste se le ponen los datos complementarios y se le da por bueno, etc ... Una cosa bastante entretenida pero laboriosa: ejemplito elink:/Las noches de Cabiria[VHSRip][spanishl].avi -> formato avi, origen video y audio VHS, idioma español, director Fellini, título original Le notti di Cabiria, etc ... rematado con la información que sí se puede obtener automáticamente: fecha de posteo, autor, post(s) donde apareció, etc ...
Lo que planteas es lo idóneo, pero me temo que es liar mucho la madeja. Lo veo más laborioso que coger y purgar a mano la lista, con eso te lo digo todo

(lo digo por lo que comentas de coger 15 voluntarios y que remitan informaciones y tal... creeme por experiencia que cuando algo requiere algo de más de 2 pasos, tira mucho para atrás)
Seguramente no se podrían incorporar carátulas y para agilizar ni siquiera sinopsis o actores. Pero sí los campos realmente útiles a la hora de hacer una búsqueda: director, año, posiblemente género, formato, y poco más (para lo otro ya está imdb, amén que automáticamente se podría incluir la dirección del post original donde seguramente sí figurará esa información)
Creo que sería conveniente ver como funciona la modificacion del Ant Movie de superlopez para esto ya que si funciona, lo hace todo solito y me parece un poco trabajo innecesario en caso de que ese script lo haga
Cuando todos los enlaces estén limpios habremos obtenido una tabla independiente dentro de una base de datos, como el resto del web, y será relativamente sencillo crear una herramienta (un módulo php) realmente útil y potente de búsqueda, selección y ordenación de enlaces.
No descarto esta opción y si alguien la pone en bandeja cuenta con mi colaboración para ser llevado a cabo, pero lo de la sencillez no acabo de verlo

honestamente. Es un proceso más lioso del que imaginas.
Para la administración y actualización
A ver si arrancamos el modulo y ya hablaremos de actualizaciones. Es un tema altamente farragoso, hay que hackear el módulo de administración del nuke y eso es tremendamente arriesgado. Tema muy denso.
Creo que batí el record al post más tostón. Por supuesto todo esto no son más que ideas perfectamente desechables y vuelvo a insistir que todo depende de qué queremos obtener y para cuando
Son grandes ideas pero no son simples. Y si no son simples te vas a ver solo porque no todo el mundo tiene nociones. Ese es el problema que le veo yo al asunto. Yo puedo cooperar pero cuando se habla de modulos, SQL, php.... salen despavoridos lo digo por experiencia.
Si ya lo tenéis claro y esta vía solo complica las cosas ya está olvidada, si lo que interesa es el listado de elinks, un mensaje pivado y os lo mando y punto. Si se pueden aprovechar unas cosas sí y otras no, pues como digais.
Yo no cierro la vía y ofrezco mi colaboración para lo que propones. No lo descarto. Aunque confieso que pensé que se trataba de extraer la lista en bruto y luego pulirla "a mano" como hizo unoqueva y veo un tanto intrincado el proceso que propones.
Un saludo
