La IA se ha convertido en un problema para las páginas web que tienen una gran cantidad de información, como The Internet Archive.
Entrenar una IA no es fácil y, de hecho, se necesita una gran cantidad de información para que sea lo suficientemente inteligente como para ser útil. La información de la que se alimenta la IA suele provenir de fuentes accesibles para todos, como The Internet Archive..
Sí, estamos hablando de la página que tiene una enorme cantidad de información relacionada con infinidad de áreas y que es de dominio público. Internet Archive es uno de los pocos oasis de información que se pueden encontrar en Internet y que se nutre de una comunidad de lo más activa en Internet.
En este día, Internet Archive se ha visto obligado a comunicar a los usuarios que su funcionamiento no está siendo el adecuado y que el principal culpable es una IA que está en formación y que, por desgracia, está accediendo a toda la información de la web de forma incesante.
Al acceder a él de esta forma, lo que está provocando que The Internet Archive sufra continuos bloqueos y, sobre todo, que los usuarios no puedan visitar el enorme archivo de Internet que se almacena dentro de esta página web. Es un problema serio tanto para los usuarios como para la organización sin fines de lucro.
Internet Archive se está utilizando para entrenar una IA
Lo que ha comunicado la propia web es que se ha detectado tráfico totalmente irracional y abusivo que proviene de AWS, también conocidos como servicios en la nube de Amazon para informática. Estos servicios estarían solicitando acceso a la web de forma masiva y constante.
Internet Archive ha sido el que ha ofrecido información y conjeturas sobre lo que está ocurriendo. Según lo dicho, alguna empresa estaría recopilando textos del sitio web de manera extremadamente incesante. que la pagina se ha caido ya que no ha podido soportar el trafico generado por todas estas solicitudes.
Está claro que los avances en IA son necesarios y que las empresas necesitan datos, pero el poder que tienen las empresas para hacer que una página web no esté disponible en cualquier momento porque necesitan acceder a los datos de una manera cuestionable es cuestionable. tan intenso que los usuarios no pueden disfrutar del contenido que ellos mismos han aportado.