Entrevista con Víctor Deutsch, Programming Area Director de IMMUNE Technology Institute
Víctor: Hoy, 5 de diciembre de 2025, a primera hora de la mañana, millones de usuarios en todo el mundo experimentaron lo que parecía un apagón digital. LinkedIn no funcionaba. Discord estaba caído. Incluso Downdetector—la propia herramienta que nos dice cuándo internet está roto—había desaparecido. La culpable: Cloudflare, la empresa que gestiona aproximadamente el 20% del tráfico global de internet.
Tras tres décadas trabajando en infraestructura digital y transformación tecnológica, he visto estos momentos antes. Y sé que generan muchas preguntas. Así que hablé con los compañeros de IMMUNE para desgranar qué pasó exactamente, qué significa realmente, y cómo deberías prepararte para el futuro digital que viene.
IMMUNE: ¿Es esto normal? ¿Hemos vuelto a confiar demasiado en una sola empresa?
Víctor: Buena pregunta, y la respuesta es incómoda: sí y no.
No, esto no es "normal" en el sentido de que no sucede cada semana. Pero tampoco es una sorpresa aislada. Este es el tercer incidente importante de Cloudflare en apenas 18 días, la caída de noviembre duró 3+ horas, la de hoy unos 40 minutos. Y si miramos el panorama completo de 2025, hemos visto múltiples outages masivos en Google Cloud, AWS, Microsoft 365...
Lo realmente importante es entender por qué sucede esto. No es cuestión de incompetencia o negligencia. El problema es sistémico: cuando construyes infraestructura que sirve el 20% de internet, un cambio de configuración en tu sistema afecta a todos los que dependemos de ti de formas que ni siquiera sabemos.
IMMUNE: La caída fue causada por un cambio en el Web Application Firewall. ¿Esto debería preocuparme como usuario?
Víctor: Todos estos incidentes son investigados en profundidad y todavía es muy pronto para conocer todos los detalles. De momento, Dane Knecht, CTO de Cloudflare ha declarado que la compañía identificó una vulnerabilidad en los sistemas que podría haber sido explotada por un atacante. Por eso, decidieron desplegar un parche para corregir el problema y proteger a sus clientes, pero en ese proceso, se deshabilitaron algunos servicios lo que generó volúmenes masivos de errores. No obstante, hay que esperar los resultados finales de la investigación para conocer todas las causas del incidente.
IMMUNE: ¿Por qué parece que estas caídas son cada vez más frecuentes y afectan a más servicios simultáneamente?
Víctor: Primera: La cantidad de dispositivos y aplicaciones que hoy en día dependen de una conexión de Internet de muy baja latencia. De una red muy rápida. Nos acostumbramos a unos altísimos niveles de servicio y una degradación aunque sea moderada o breve nos resulta muy notoria y molesta.
Segunda: Complejidad del stack tecnológico. Los sistemas modernos no son simples. Cloudflare maneja simultáneamente CDN, DNS, DDoS protection, WAF, Workers (serverless), KV storage, Access (zero trust)... Si el WAF falla, potencialmente todo falla. Los puntos de interdependencia son invisibles para el usuario final.
Tercera: Velocidad de cambio. En 2005, los cambios en infraestructura crítica se desplegaban cada 6 meses. Hoy, desplegamos cien veces al día. A mayor frecuencia de cambios, más oportunidades para errores. No porque los equipos sean menos competentes, sino porque la complejidad crece más rápido que nuestra capacidad de testearlo todo.
Entonces: ¿más frecuentes? Técnicamente, en términos absolutos, probablemente no. Pero la visibilidad es mayor, el impacto es mayor, y la dependencia es mayor.
IMMUNE: ¿Debería mi empresa tener un "Plan B" si Cloudflare cae? ¿Existe una alternativa?
Víctor: Claro, existen alternativas de "redundancia arquitectónica". Algunas empresas grandes distribuyen su tráfico entre Cloudflare y otros proveedores.
También se puede diseñar los servicio digitales de forma que si el CDN falla, tengas una "versión degradada" que funcione.
Pero como el 100% de seguridad es imposible de lograr, es importante tener plan claro de comunicación cuando cosas como esto suceden. No es prevención, es gestión del daño.
IMMUNE: Este es un problema de infraestructura, ¿verdad? ¿No es entonces realmente un problema de ciberseguridad?
Víctor: Uno de los pilares de la ciberseguridad es garantizar la disponibilidad de la información. Qué disponible dónde y cuándo la necesito. En ese sentido lo ocurrido es un problema de ciberseguridad aunque no fue un ataque cibernético.
IMMUNE: ¿Qué debería aprender de esto alguien que quiere desarrollar carrera en tecnología o infraestructura?
Víctor: Si trabajas o quieres trabajar en tecnología, no construyas sistemas creyendo que "si es importante, debe funcionar". Construye sistemas creyendo que todo fallará en algún momento. Esa mentalidad cambia todo.
Aprende sobre:
- Arquitectura de tolerancia a fallos: Cómo diseñar sistemas que continúan funcionando cuando los componentes fallan
- Observabilidad: No es monitoreo. Es la capacidad de entender qué está sucediendo en tu sistema en tiempo real cuando sucede algo inesperado
- Comunicación de crisis: Porque el 70% del daño en un outage no es el downtime. Es la incertidumbre. Los clientes aceptan fallos técnicos. No aceptan ignorancia.
- Pensamiento sistémico: Entender cómo tus decisiones arquitectónicas crean dependencias que otros vivirán después
En IMMUNE, nuestros cursos de Cybersecurity, Cloud Architecture y Programming no son solo sobre "aprender a hacer cosas". Son sobre prepararte para la complejidad real. Y eventos como el de hoy, aunque molestos, son exactamente para qué existen esas preparaciones.
El futuro digital necesita personas que entiendan que la resiliencia no es un lujo. Es una necesidad fundamental.
Conclusión: No es paranoia. Es realismo.
Hace una hora, una quinta parte de internet cayó. No porque fuera atacada. No porque alguien cometiera un error incompetente. Sino porque hemos construido internet de una manera donde eso es posible.
Como usuario, puedes respirar tranquilo. No fue un ataque. Tu contraseña es segura.
Como empresa, deberías estar pensando en redundancia.
Como aspirante a profesional de tecnología, deberías estar observando, aprendiendo, y tomando nota mental de cada decisión arquitectónica que hace que esto suceda.
Porque si trabajas en infraestructura durante los próximos 10 años, tu trabajo será exactamente esto: hacer que todo sea menos frágil.
Y eso, amigos, es lo más importante que la tecnología actual necesita.
Víctor Deutsch es Programming Area Director y Director del Computer Entrepreneurship Bachelor en IMMUNE Technology Insitute, con 30 años de experiencia en Transformación Digital e Infraestructura Crítica. Las opiniones expresadas aquí reflejan su perspectiva profesional sobre resiliencia digital y arquitectura de sistemas a escala.