logo Gobiyou

Seguinos en:

logo Facebook logo twitter logo rss
eshop

Para que sirven los captchas.

Compartí esta historia:
votar








ReCaptcha (y quizás otros sistemas de captcha) sirven más que para su cometido.

Y es que el cometido obvio, por así decirlo, de los sistemas de captcha es el de generar un desafío (challenge en inglés) para que ante un formulario el sistema web pueda asegurarse de que el que realizó la acción fue un ser humano y no un script o bot programado. Es entendible entonces como los sistemas de captcha evolucionan y van poniendo las letras cada vez mas complejas, tachadas o incompletas, ya que hecha la ley, hecha la trampa, y muchos hackers programan sistemas OCR para que rellenen automáticamente estos desafíos y completen automáticamente cualquier formulario o lo que sea.

Pero, al menos en reCaptcha, también hay otro objetivo
 y es genial como lo implementan.


Este sistema, comprado por Google hace unos años, utiliza la “inteligencia colectiva” para que los humanos que rellenan formularios (o sea, nosotros) ayudemos a digitalizar textos. Los que han usado esto sabrán que cuando nos enfrentamos a un reCaptcha vemos 2 palabas: Una es la de control y la otra es el desafío (para el sistema). La de control el sistema la conoce, y la otra es la que el sistema está ingresando… ¿Pero a qué y para qué?











El tema es así, supongamos que somos Google y queremos digitalizar ediciones muy viejas de el New York Times. Primero le pagamos a gente para que ponga las hojas en un scanner (o sean escaneados por sistemas automáticos, da igual). La cuestión es que por más bueno que sea el software OCR, los diarios antiguos, por la mala calidad de impresión sumado al tiempo, tienen palabras irreconocibles…








El software OCR toma las palabras irreconocibles, las remarca, y se las manda a la API de reCaptcha para que los humanos que llenan formularios escriban “lo que les parece que dice”.








Obviamente si el sistema pone mil veces la siguiente palabra…








Mediante el algoritmo va a ir tomando los ingresos de los humanos que llenan formularios y determinará que esa palabra es DOUGLAS, (con coma) y a partir de que miles y miles escriban lo mismo, dará la palabra por sentado y además lo tendrá ingresado en la API como un desafío confiable.

Una vez que el sistema envía y recibe el feedback oculto de la comunidad (todo esto sin que casi nadie se entere que trabaja digitalizando texto) puede entregar el texto digitalizado con un 99,5% de efectividad ¿Groso? Miren el resultado final.












El sistema no “valida” la palabra nueva como challenge, solamente lo hace con la de control, así que la primera (a veces varía el orden) es como desafío y la segunda es para “digitalizar”.




fuente
Compartí esta nota tambien en:

  • Agregar a Technorati
  • Agregar a Del.icio.us
  • Agregar a DiggIt!
  • Agregar a Yahoo!
  • Agregar a Google
  • Agregar a Meneame
  • Agregar a Furl
  • Agregar a Reddit
  • Agregar a Magnolia
  • Agregar a Blinklist
  • Agregar a Blogmarks
  • votar

Gracias por visitarnos, tenes alguna pregunta? mandanos un mensaje aqui.
Por favor déjanos tu comentario a continuación. Suscríbite logo feed

0 comentarios:

Publicar un comentario

Related Posts Plugin for WordPress, Blogger...
 

Licencia de Creative CommonsGobiyou by GOBIYOU is licensed under a Creative Commons Reconocimiento-CompartirIgual 3.0 Unported License
Mi Ping en TotalPing.com Vota por este sitio en Los Mejores de RedFind Calcula los usuarios online de tu web o blog
ir arriba