Mundo > Los detalles
Cloudflare aclaró que su falla global no fue un ciberataque y explicó su origen técnico
Tras ocho horas de interrupciones masivas que afectaron a plataformas como ChatGPT, X y League of Legends, Cloudflare atribuyó la caída a un error interno en su sistema y descartó acciones maliciosas.
POR REDACCIÓN
El 18 de noviembre de 2025, Cloudflare sufrió una interrupción global que afectó a miles de sitios web y aplicaciones durante aproximadamente ocho horas, generando fallas en servicios como X, ChatGPT, Canva y League of Legends. La empresa aclaró que el incidente no fue producto de un ciberataque ni de ninguna actividad maliciosa, sino que tuvo un origen técnico interno.
Matthew Prince, CEO de Cloudflare, detalló en un comunicado oficial que la causa principal fue un cambio inadvertido en los permisos de una base de datos, lo que provocó la duplicación de información en un archivo crítico para el sistema que detecta bots. Este archivo aumentó su tamaño más allá de lo esperado, causando una cadena de fallas en la red global de la compañía.
Cloudflare, reconocida por sus servicios de seguridad y optimización del tráfico web, utiliza una red diseñada para filtrar tráfico malicioso y proteger a los usuarios legítimos. Sin embargo, el archivo defectuoso afectó directamente al sistema Turnstile, encargado de verificar que los usuarios no sean bots, así como a otros servicios esenciales como Workers KV y el panel de control de la empresa.
El problema comenzó a las 11:20 UTC (8:20 de Argentina), cuando múltiples sitios comenzaron a mostrar errores. Inicialmente, el equipo de Cloudflare sospechó un ataque masivo, pero pronto identificaron que la raíz era un archivo de configuración dañado que se propagó automáticamente a todos los servidores globales. A las 14:30 UTC (11:30 de Argentina) lograron detener la propagación y restaurar una versión anterior del archivo, y para las 17:06 UTC (15:06 de Argentina) la red volvió a operar con normalidad.
El error se originó tras una modificación destinada a mejorar la seguridad de la base de datos ClickHouse, que duplicó la cantidad de datos devueltos por una consulta. Esto provocó que el archivo que alimenta el sistema antibots excediera su límite permitido, desencadenando un fallo en el software que gestiona el tráfico y generando errores en cascada.
Parte de la solución implicó bloquear la generación del archivo defectuoso y reemplazarlo manualmente por una versión correcta. A pesar de que la restauración comenzó rápidamente, otros servicios conectados también colapsaron por efecto dominó, lo que complicó la recuperación total.
Cloudflare reconoció que esta fue su peor interrupción desde 2019, dado que afectó el tráfico principal de su red global y no solo herramientas específicas. La compañía pidió disculpas públicamente y comunicó que implementará medidas más estrictas para evitar futuras fallas, incluyendo controles más rigurosos sobre los archivos internos, mejores mecanismos para desactivar funciones problemáticas y revisiones para evitar saturaciones de recursos críticos.
Matthew Prince manifestó que la situación fue “muy dolorosa para todos los miembros de nuestro equipo” y asumió la responsabilidad afirmando: “hoy les hemos fallado”. Además, destacó que, dada la importancia de Cloudflare en el ecosistema digital, cualquier interrupción es “inaceptable” y lamentó profundamente las molestias causadas a sus clientes y a Internet en general.
Este episodio evidenció la gran dependencia que la economía digital tiene sobre proveedores clave de infraestructura como Cloudflare. La caída afectó desde redes sociales hasta aplicaciones de inteligencia artificial y videojuegos, dejando a millones de usuarios sin acceso a plataformas esenciales y dificultando la evaluación precisa del alcance de la falla debido a la caída simultánea de herramientas de monitoreo.
La magnitud del incidente subraya la centralidad de Cloudflare en el funcionamiento diario de Internet, ya que numerosos sitios web, aplicaciones móviles y plataformas de juego confían en sus servicios para protegerse de ataques, gestionar altos volúmenes de tráfico y garantizar la disponibilidad continua.