Quiénes somos

Tú que sabes leer…

A lo largo de los últimos días por la pestaña de moderación de este ‘blog’ han pasado más de 600 comentarios de ‘spam’. Nuestro filtro los ha reconocido todos (menos uno), pero la sensación que queda tras una oleada de este tipo es que la cantidad de mierda a la que nos exponemos es cada vez mayor. Los contenedores tradicionales de basura (los buzones de correo) son ahora sólo una caja más que llenar con la enorme cantidad de información inútil que tenemos que sortear a diario.
Una de las alternativas que habíamos pensando para frenar la marea era empezar a distinguir con más finura entre ustedes nuestros lectores y todos esos robots que vienen a vernos. ¿Cómo? Con un sencillo captcha en los formularios que nos ayudará a discriminar entre usuarios legítimos y máquinas de ‘spam’.
La idea no es mala, pero obligarles a ustedes a demostrar que son humanos sin más beneficio que ese nos parece un engorro. Y así nos cruzamos con ‘ReCaptcha’, un proyecto de lucha contra la basura con propina interesante. Según los cálculos de este colectivo cada día se resuelven 60 millones de captchas y todo ese potencial se podría usar para un bien superior: digitalizar libros.
La idea es ofrecer un doble test: la primera palabra a resolver es un captcha tradicional y la segunda es una palabra que los lectores OCR (que traducen texto escaneado para proyectos de digitalización) no han sabido leer correctamente. Así el sistema reconocería el primer reto como resuelto por un humano y daría como válida la interpretación de la segunda palabra, proveniente del archivo de ‘Internet Archive’ de términos mal leídos por los sistemas automáticos de reconocimiento de texto.
Así cada usuario, al demostrar que es ‘humano’ tras solucionar el primer captcha, leería de forma correcta la segunda palabra del formulario y engrosaría el fondo documental de términos correctamente leídos del ‘Internet Archive’.
Si la oleada de ‘spam’ persiste contra este humilde blog no descartamos incluir este método de filtrado. A ustedes les supondrá el engorro de tener que demostrar su humanidad, pero a la vez colaborarían con un enorme proyecto de digitalización de libros.

28 de Mayo, 2007 por Ícaro Moyano Díaz
1 comentario
Archivado en Internet, Spam

_comentarios

    Lo del correo basura está fuera de control. En una de mis cuentas de correo he llegado a recibir más de 5000 correos basura en 23 días.

    Adelante con lo que haga falta para reducirlo.

    28 Mayo, 2007 por Comer, hablar, amar

_deja tu comentario

nombre*
e-mail*
web
 
 

 

*obligatorio

Calendario

Septiembre 2010
L M X J V S D
« Ago «-»  
 12345
6789101112
13141516171819
20212223242526
27282930  

Archivo

Últimas entradas