¿Qué causó la interrupción de AWS de Amazon y por qué tantas aplicaciones importantes quedaron fuera de línea?

Una importante interrupción en Amazon Web Services (AWS) el lunes interrumpió una gran parte de Internet, derribando aplicaciones, sitios web y herramientas en línea utilizadas por millones de personas en todo el mundo, antes de que finalmente se restauraran los servicios.

Desde aplicaciones bancarias y aerolíneas hasta dispositivos domésticos inteligentes y plataformas de juegos, el desglose de varias horas reveló cuánto de la vida moderna depende de la infraestructura de la nube.

Historias recomendadas

lista de 1 artículofin de la lista

Esto es lo que sabemos:

¿Qué pasó y qué causó la interrupción de AWS?

Aproximadamente a las 07:11 GMT, el servicio en la nube de Amazon experimentó una interrupción importante, lo que significó que algunos de sus sistemas dejaron de funcionar, lo que interrumpió muchas aplicaciones y sitios web populares, incluidos bancos, plataformas de juegos y servicios de entretenimiento.

El problema comenzó en uno de los principales centros de datos de AWS en Virginia, su sitio más antiguo y más grande, después de una actualización técnica de la API (una conexión entre diferentes programas informáticos) de DynamoDB, un servicio clave de base de datos en la nube que almacena información del usuario y otros datos importantes para muchas plataformas en línea.

La causa principal parece haber sido un error en la actualización que afectó al Sistema de nombres de dominio (DNS), que ayuda a las aplicaciones a encontrar las direcciones correctas del servidor. Un DNS funciona como la guía telefónica de Internet, convirtiendo los nombres de los sitios web en direcciones IP numéricas que las computadoras usan para conectarse a los servidores.

Debido al problema de DNS, las aplicaciones no pudieron encontrar la dirección IP de la API de DynamoDB y no pudieron conectarse.

Cuando DynamoDB dejó de funcionar, otros servicios de AWS también empezaron a fallar. En total, 113 servicios se vieron afectados por la interrupción. A las 10:11 GMT, Amazon dijo que todos los AWS habían vuelto a sus operaciones normales, pero había una acumulación «de mensajes que terminarán de procesar en las próximas horas».

En el momento de esta publicación, Downdetector, un sitio web que rastrea los cortes de Internet basándose en informes de usuarios, todavía mostraba problemas con plataformas como OpenAI, ESPN y Apple Music.

¿Qué es una nube y qué es exactamente AWS?

Una nube es una forma de almacenar y utilizar datos o programas a través de Internet en lugar de hacerlo en su computadora u otros dispositivos de almacenamiento físico.

Cuando la gente dice que algo está “en la nube”, significa que los archivos, aplicaciones o sistemas se ejecutan en potentes computadoras (llamadas servidores) en centros de datos propiedad de empresas como Amazon (AWS), Google o Microsoft, no en su dispositivo personal.

En este caso, AWS permite a las empresas alquilar capacidad informática y almacenamiento. Proporciona la tecnología que ejecuta sitios web, aplicaciones y muchos servicios en línea entre bastidores.

Uno de los servicios principales de AWS es DynamoDB, una base de datos que almacena información importante para las empresas, como registros de clientes. El lunes, Amazon informó que los clientes no podían acceder a sus datos de DynamoDB.

AWS es el mayor proveedor de servicios en la nube del mundo.

Las interrupciones en la nube no son raras, pero se han vuelto más notorias a medida que más empresas dependen de estos servicios todos los días.

«Las consecuencias afectaron a personas en diferentes esferas», dijo a Al Jazeera Joshua Mahony, analista jefe de mercado de Scope Markets. [But] Por supuesto, esto viene con el territorio de las empresas de tecnología; la clave es que pueden resolverlo rápidamente y no les cuesta mucho dinero”.

Dijo que Amazon probablemente capearía la tormenta del incidente.

«Estamos ante algo que está relativamente contenido», dijo. «Amazon Web Services ha acaparado el 30 por ciento del mercado. Sus usuarios no van a abandonar repentinamente el barco. Sus negocios están profundamente arraigados».

¿Qué servicios y aplicaciones cayeron?

La interrupción afectó a decenas de sitios web, incluidos Snapchat, Pinterest y Apple TV, según Downdetector.

Otras aplicaciones de comunicación también se vieron afectadas entre ellas: WhatsApp, Signal, Zoom y Slack; servicios de juegos como Roblox, Fortnite y Xbox; y lugares como Starbucks. Etsy también experimentó problemas.

En Estados Unidos, la gente también tenía problemas con las aplicaciones financieras, incluido Venmo.

Algunos usuarios dijeron que sus timbres Ring y sus parlantes Alexa dejaron de funcionar, mientras que otros no pudieron acceder al sitio web de Amazon ni descargar libros en sus Kindles.

La aplicación de idiomas Duolingo y la herramienta creativa Canva estuvieron entre las que informaron errores en sus sitios web, y varias organizaciones de medios se vieron afectadas, incluidas la agencia de noticias Associated Press, The New York Times y The Wall Street Journal.

Los bancos, el intercambio de criptomonedas Coinbase y la empresa de inteligencia artificial Perplexity también informaron problemas, junto con las aerolíneas estadounidenses Delta y United.

INTERACTIVO: Principales servicios web afectados por la interrupción de AWS

¿Por qué tantas aplicaciones importantes se desconectaron a la vez?

Cuando AWS tuvo su interrupción, no fueron sólo las herramientas de Amazon las que se vieron afectadas. Miles de otras empresas que utilizan AWS para almacenamiento, bases de datos o alojamiento web también se vieron afectadas. Estas empresas incluyen muchas aplicaciones importantes que dependen de AWS para ejecutar partes clave de sus sistemas.

«Cada vez que vemos estos titulares, el primer pensamiento que pasa por la mente de todos, que provoca un escalofrío en la columna vertebral, es: ‘¿Es este uno de esos ciberataques? ¿Es algo militar o de inteligencia lo que ha llevado a esta interrupción?’ Y en este caso, no lo es”, dijo a Al Jazeera Bryson Bort, director ejecutivo de la empresa de ciberseguridad Scythe.

«De hecho, la mayoría de las veces no lo es. Generalmente es un error humano».

¿Cómo respondió Amazon?

AWS reconoció la interrupción y dijo que los ingenieros estaban «contratados de inmediato» para solucionar el problema.

AWS dijo que trabajó en “múltiples caminos paralelos para acelerar la recuperación”. También informó que el problema principal se había resuelto por completo, aunque algunos usuarios continuaron enfrentando retrasos menores a medida que los sistemas se recuperaban.

La compañía también dijo que publicaría un resumen detallado posterior al evento explicando lo sucedido.

Una vista aérea de un centro de datos de servicios web de Amazon
Una vista aérea de un centro de datos de Amazon Web Services, conocido como US East 1, en Ashburn, Virginia. [Jonathan Ernst/Reuters]