Inicio / Insight / Indisponibilidad servicios AWS 20/10/2025
Indisponibilidad servicios AWS 20/10/2025
Barcelona, 20 de octubre de 2025
La caída global registrada esta mañana en Amazon Web Services (AWS) ha puesto en evidencia, una vez más, la fragilidad de los ecosistemas digitales excesivamente concentrados en un único proveedor cloud. A partir de las 8:40h se ha observado un incremento significativo de errores y latencias en varios servicios troncales de AWS, con epicentro en la región US-EAST-1, provocando interrupciones en cascada a escala mundial, incluida España.
El incidente parece haberse originado en los Estados Unidos, centrado en la interrupción del servicio DynamoDB. Sin embargo, su efecto de cascada ha sido global, afectando directamente a España. Esta propagación se debió a la interdependencia crítica de los servicios de AWS: el fallo inicial de DynamoDB provocó inmediatamente la inestabilidad de componentes fundamentales como IAM (Identity and Access Management), SQS (Simple Queue Service), Lambda y EC2, servicios esenciales para el control, identidad y monitorización de las plataformas empresariales.
En España, el impacto ha sido visible en plataformas de consumo masivo –las que primero identifica el gran público– y, sobre todo, en aplicaciones empresariales donde dada la penetración de AWS en el tejido digital del Estado, ha tenido un efecto de ralentizaciones severas hasta indisponibilidad de servicios en sectores clave.
Esto expone la vulnerabilidad sobre la que pivota la estrategia de infraestructura digital de nuestro país, con efectos medibles en dos dimensiones:
- En el corto plazo, productividad operacional y pérdida de transacciones: Los sectores más afectados son el e-commerce, los servicios financieros con alta exposición digital, y otros negocios de base tecnológica. La incapacidad para acceder a servicios front-end (aplicaciones, webs) o back-end (bases de datos, logs, plataformas de analytics) normalmente se traduce directamente en pérdida de ingresos por transacciones no realizadas y una caída inmediata de la productividad laboral.
- En el medio plazo, pérdida de confianza y riesgo reputacional: Para las empresas afectadas, la interrupción de los servicios daña la percepción de fiabilidad ante sus clientes. En un mercado altamente competitivo, el coste de la desconfianza a largo plazo puede ser más alto que la pérdida transaccional de un día.
Las organizaciones españolas, en su proceso de la digitalización, han externalizado no solo la infraestructura, sino también la resiliencia. Han trasladado la complejidad, pero no han mitigado el riesgo y este incidente cuestiona un supuesto extendido y pone de relieve un hecho estructural crítico:
- El primero, el mito de la resiliencia automática en la nube: operar en múltiples regiones no garantiza continuidad si servicios fundamentales se concentran y dependen de un único punto.
- El segundo, evidencia que la concentración de riesgo en un único hiperescalar, provoca que cualquier fallo mayor de éste se convierta en una vulnerabilidad de infraestructura. Además, obliga a revisar el coste real de la nube, pues las compensaciones por incumplimiento SLA son insignificantes frente a las pérdidas de productividad, reputación y negocio. Las organizaciones deben integrar en su análisis económico el coste de la indisponibilidad y las inversiones necesarias para arquitecturas verdaderamente resilientes, que a menudo implican estrategias multicloud o híbridas.
Una vez se recuperen los servicios y con visión de futuro las empresas deben evitar la reacción superficial de “buscaremos otro proveedor cloud“. Sustituir un hiperescalar por otro sin cambiar la estrategia de arquitectura solo traslada el riesgo.
Por el contrario, este evento debería servir de catalizador para que los CIOs y responsables técnicos se replanteen su enfoque de resiliencia sobre la infraestructura, centrándose en tres ejes clave:
- Desplegar y operar los servicios más críticos en múltiples zonas de disponibilidad (AZs) o, preferentemente, en múltiples regiones geográficas (por ejemplo: España eu-south-2 y Alemania eu-central-1).
- Implementar una arquitectura multi-cloud estratégica real: No se trata de usar dos proveedores para todo, sino de utilizar un segundo hiperescalar como plan de contingencia para las bases de datos y servicios de identidad más esenciales, en caso de fallo catastrófico del proveedor principal.
- Identificar y aislar los servicios críticos de la dependencia del plano de control central (como el servicio que ha fallado hoy), utilizando herramientas de gestión de identidad y monitorización descentralizadas o híbridas.
En conclusión la interrupción de AWS es un síntoma de la dependencia excesiva de terceros y la falta de planificación de la resiliencia en las empresas. La nube es la herramienta, no un sustituto de la estrategia, y es que la responsabilidad última de la continuidad del negocio siempre recae sobre la empresa que contrata los servicios.
Marc Isern
Digital Advisor en Penteo
Utilizamos cookies propias y de terceros para fines analíticos y para mostrarte publicidad personalizada en base a un perfil elaborado a partir de tus hábitos de navegación (por ejemplo, páginas visitadas). MÁS INFORMACIÓN