Claude Mythos vulnera Apple M5: así quedó expuesta la seguridad del chip más avanzado de Apple

  • Una pequeña startup usó Claude Mythos para romper en días las defensas MIE del chip Apple M5 en macOS 26
  • El exploit combina dos vulnerabilidades y logra acceso root desde un usuario local sin privilegios
  • La IA de Anthropic actuó como acelerador clave, pero la pericia humana siguió siendo imprescindible
  • El caso anticipa una nueva etapa de ciberataques en Europa y el resto del mundo impulsados por modelos de IA avanzados

Seguridad de Apple M5 y Claude Mythos

Durante años, los ordenadores de Apple han sido vistos como uno de los entornos más seguros del mercado, en buena parte gracias a la estrecha integración entre su hardware y su software. El lanzamiento de los chips M5 y de la tecnología Memory Integrity Enforcement (MIE) pretendía reforzar todavía más esa imagen de fortaleza frente a ataques avanzados.

Esa sensación de blindaje se ha tambaleado tras conocerse que una pequeña empresa de ciberseguridad, Calif, ha conseguido desarrollar un exploit funcional contra macOS en M5 en cuestión de días, apoyándose en Claude Mythos, un modelo de inteligencia artificial experimental de Anthropic especializado en ciberseguridad ofensiva. El caso ha encendido las alarmas en el sector tecnológico europeo y mundial sobre el papel de la IA en los futuros ciberataques.

Cómo se vulneró el chip Apple M5 con ayuda de Claude Mythos

Según la información difundida por Calif, el equipo inició la investigación el 25 de abril, cuando detectó fallos en macOS 26 ejecutándose sobre hardware Apple M5 con MIE activado. Menos de una semana después, entre el 30 de abril y el 1 de mayo, ya disponían de un exploit completamente operativo capaz de comprometer el sistema.

El ataque parte de un escenario relativamente común: un usuario local sin privilegios en la máquina. A partir de ahí, la cadena de explotación permite escalar hasta obtener acceso root al kernel de macOS, es decir, el máximo nivel de control sobre el sistema.

Para lograrlo, el exploit combina dos vulnerabilidades distintas de macOS con varias técnicas de corrupción de memoria específicamente diseñadas para el chip M5 y para sortear las defensas de Memory Integrity Enforcement. Esta combinación es lo que convierte el ataque en un ejemplo especialmente preocupante para la industria.

Los investigadores relatan que el proceso fue muy rápido: en apenas cinco a seis días de trabajo efectivo pasaron del descubrimiento inicial a una prueba de concepto totalmente funcional en macOS 26.4.1, ejecutado en bare metal sobre M5 y con MIE activado.

Qué papel jugó realmente Claude Mythos en el ataque

Uno de los puntos clave del caso es que Calif no atribuye el resultado a una IA actuando en solitario, sino a la colaboración entre expertos humanos y Claude Mythos. La startup describe el modelo de Anthropic como un multiplicador de fuerza que acelera las fases más pesadas del análisis y la explotación.

Claude Mythos Preview, la versión utilizada, es un modelo experimental de Anthropic orientado a ciberseguridad ofensiva y análisis de vulnerabilidades. No está disponible para el público general: su uso se limita a un programa privado, Project Glasswing, al que tienen acceso grandes tecnológicas, bancos e investigadores seleccionados.

En este caso, la IA ayudó a detectar rápidamente errores pertenecientes a categorías de fallos ya conocidas, a revisar grandes volúmenes de código y a proponer cadenas de explotación posibles. Donde la cosa se complicó fue en eludir MIE, una mitigación relativamente nueva para la que todavía no existe un “recetario” automatizado.

Los propios investigadores de Calif subrayan que la experiencia humana siguió siendo decisiva para ajustar el exploit, afinar las técnicas de corrupción de memoria y conseguir una escalada de privilegios estable. La IA, insisten, no inventó una técnica completamente inédita, pero sí recortó dramáticamente los tiempos de iteración.

Memory Integrity Enforcement: la barrera que Apple creía infranqueable

Memory Integrity Enforcement (MIE) es una de las grandes apuestas de Apple para reforzar la seguridad de iOS y macOS en sus últimas generaciones de procesadores, incluidos los M5 presentes en Mac más recientes. La compañía llevaba varios años desarrollando esta tecnología, que se apoya en características de hardware específicas.

MIE se basa en la extensión Memory Tagging Extension (MTE) de Arm, un mecanismo que asigna etiquetas a distintas regiones de memoria. El objetivo es detectar accesos indebidos y bloquearlos antes de que un exploit de corrupción de memoria pueda tomar el control del sistema o escalar privilegios.

Este tipo de ataques es especialmente crítico porque puede permitir desde el robo silencioso de información hasta el dominio completo de un dispositivo, sin que el usuario perciba síntomas claros. Por eso Apple presentó MIE como una pieza central en su estrategia de seguridad para los chips M5.

Que un equipo pequeño haya sido capaz de eludir MIE en menos de una semana con el apoyo de una IA especializada se interpreta en el sector como una señal preocupante. No porque el sistema se anunciara como imposible de vulnerar, sino porque su coste de explotación se ha reducido drásticamente respecto a lo que Apple pretendía.

Detalles del exploit: de un usuario sin privilegios a controlar el kernel

La información técnica que ha trascendido, todavía incompleta a la espera de un parche oficial, describe el exploit desarrollado por Calif como una cadena de escalada de privilegios del kernel. El ataque se apoya únicamente en llamadas normales al sistema, sin necesidad de hardware externo ni interacción compleja del usuario.

El flujo general sería el siguiente: se parte de un usuario local sin privilegios, se abusa de una primera vulnerabilidad para ganar cierto nivel de acceso adicional y, a continuación, se encadena con un segundo fallo que permite comprometer la integridad de la memoria protegida por MIE.

Para lograr superar la mitigación, los investigadores tuvieron que combinar varias técnicas de corrupción de memoria altamente especializadas, ajustadas al comportamiento de MTE y a la forma concreta en la que Apple implementa MIE en los chips M5. Ahí es donde la supervisión humana resultó indispensable.

Calif ha preparado un informe técnico de 55 páginas que describe con detalle la vulnerabilidad y el exploit, pero ha decidido no publicarlo hasta que Apple despliegue todas las correcciones. Sí han compartido el contenido de forma privada con la compañía durante una reunión presencial en Apple Park, siguiendo las prácticas de divulgación responsable.

Reacción de Apple y posibles implicaciones en Europa

Hasta el momento, Apple no ha emitido comentarios públicos sobre el incidente ni ha detallado qué medidas piensa adoptar. Tampoco se ha asignado de forma oficial un identificador CVE visible públicamente asociado a esta vulnerabilidad concreta.

Históricamente, la empresa suele revisar los hallazgos de forma interna, preparar parches en silencio y, posteriormente, publicar notas de seguridad en nuevas versiones de macOS y iOS. La información detallada sobre la explotación concreta suele ser limitada, precisamente para evitar que otros actores copien el ataque.

Para usuarios y organizaciones en España y el resto de Europa, la principal consecuencia práctica es la necesidad de mantenerse muy atentos a futuras actualizaciones de macOS para equipos con chip M5. Hasta que no exista un parche oficial, el exploit no puede darse por totalmente mitigado, aunque tampoco hay constancia pública de que se esté utilizando de forma activa fuera de los laboratorios de investigación.

En el ámbito regulatorio europeo, este caso alimenta el debate sobre la responsabilidad de los proveedores de IA de alto impacto y la necesidad de controlar el acceso a modelos capaces de asistir en ciberataques, algo que encaja de lleno con las preocupaciones expresadas en el marco de la Ley de IA de la UE.

Claude Mythos, la IA ofensiva que inquieta a la industria

Claude Mythos Preview no es un modelo generalista orientado al gran público, sino una IA diseñada específicamente para analizar, detectar y explotar vulnerabilidades de software. Forma parte de Project Glasswing, una iniciativa privada en la que participan compañías como Google, Microsoft o Amazon Web Services.

Las pruebas internas de Anthropic apuntan a que Mythos supera a herramientas convencionales de IA en la identificación y explotación de fallos de seguridad. En ensayos con Mozilla, por ejemplo, el modelo habría detectado más de 270 vulnerabilidades en Firefox, muchas de ellas críticas.

Informes del Instituto de Seguridad de IA del Reino Unido señalan que modelos como Mythos son capaces de simular ciberataques complejos en varias etapas, generando cadenas de explotación completas y adaptándose a diferentes entornos. También se ha mencionado su uso por parte de agencias gubernamentales estadounidenses, incluida la NSA, en contextos de investigación.

En este contexto, el caso de M5 se percibe como un punto de inflexión: por primera vez, un modelo de este tipo aparece vinculado de forma directa a la ruptura de una de las defensas de hardware más avanzadas de un fabricante de referencia como Apple.

La economía del hacking cambia: menos recursos, más impacto

Uno de los mensajes más repetidos por Calif es que la combinación de equipos reducidos y modelos de IA avanzados está cambiando el equilibrio de poder en ciberseguridad. Lo que antes requería grandes presupuestos y plantillas muy numerosas ahora puede estar al alcance de startups especializadas o incluso de grupos de investigación pequeños.

Durante la reunión en Apple Park, los representantes de la compañía de la manzana presumieron, según ha trascendido, de los miles de millones invertidos en su sede y en sus sistemas de seguridad. Desde Calif respondieron con cierta ironía, recordando que sus oficinas habían costado «algo menos» y que, aun así, habían logrado superar una de las defensas estrella de la compañía.

En términos prácticos, esto significa que el tiempo necesario para encontrar y explotar vulnerabilidades críticas se está reduciendo de meses a días. Para empresas tecnológicas europeas, incluidas las que operan en España, este cambio obliga a replantear los ciclos de actualización y la inversión en equipos defensivos.

Los investigadores alertan de que muchas tecnologías de mitigación se diseñaron en un mundo anterior a modelos de IA como Mythos. Si los atacantes pueden apoyarse en estas herramientas para automatizar parte del trabajo pesado, las barreras existentes podrían dejar de ser un freno real para actores bien organizados.

Impacto y riesgos para empresas europeas y españolas

Para compañías que desarrollan software, servicios en la nube o plataformas digitales en Europa, este caso es un aviso claro: las defensas basadas solo en hardware o mitigaciones clásicas ya no son suficientes. La velocidad a la que se pueden explotar fallos ha cambiado, y con ella el margen de respuesta.

En el entorno empresarial español, donde muchas organizaciones aún están en proceso de madurar sus estrategias de ciberseguridad, este tipo de incidentes pone de relieve la importancia de integrar la seguridad desde el diseño (security by design) y no como un añadido de última hora.

Los expertos recomiendan, entre otras medidas, reforzar los programas de bug bounty para atraer a investigadores independientes antes de que los fallos lleguen a manos de actores maliciosos. También se apunta a la necesidad de incorporar herramientas de análisis estático y dinámico asistidas por IA en los ciclos de desarrollo.

Para los proveedores de servicios críticos en sectores como la banca, la energía o las telecomunicaciones, la conclusión es clara: la configuración actual de evaluación de riesgos debe contemplar explícitamente el uso ofensivo de IA, tanto por parte de grupos criminales como de posibles actores estatales.

Una nueva etapa en la carrera entre defensores y atacantes

El exploit contra los chips M5 no es el primer ejemplo de inteligencia artificial aplicada a la investigación ofensiva en ciberseguridad, pero sí uno de los más visibles y concretos. Llega, además, en un momento en el que la discusión sobre la regulación de modelos avanzados está en pleno auge en la Unión Europea.

Especialistas de reconocido prestigio recuerdan que macOS es un objetivo difícil y que vulnerar su kernel con las últimas mitigaciones activadas es un logro significativo desde el punto de vista técnico. Al mismo tiempo, advierten de que parte del entusiasmo mediático alrededor de la IA puede estar sobredimensionando su papel frente al de los equipos humanos.

El consenso actual entre muchos expertos se resume en dos ideas: la IA ya está cambiando la economía del hacking, reduciendo tiempos y costes, pero todavía no sustituye a la pericia de los investigadores especializados. Su función, por ahora, es amplificar capacidades más que operar de forma totalmente autónoma.

Calif define su trabajo sobre M5 como «un vistazo de lo que está por venir» y habla incluso de un posible «bugmageddon» impulsado por IA, en el que el volumen y la velocidad de los descubrimientos de fallos podrían poner a prueba los límites de respuesta de fabricantes y administraciones.

El episodio de Claude Mythos y el chip Apple M5 ilustra hasta qué punto los modelos avanzados de inteligencia artificial pueden transformar el equilibrio entre defensores y atacantes en ciberseguridad: una pequeña startup apoyada en una IA especializada ha logrado, en cuestión de días, sortear una de las protecciones de hardware más ambiciosas de Apple, obligando a la industria —también en España y Europa— a replantearse sus estrategias de protección, sus tiempos de reacción y el papel que la propia IA tendrá en la defensa de los sistemas en los próximos años.

Exploit de corrupción del kernel en macOS sobre chip M5
Artículo relacionado:
Exploit de corrupción del kernel en macOS sobre chip M5 pone a prueba MIE y la IA ofensiva