
Cerca del 67% de las cuentas de Anthropic baneadas usaron IA para prepararse para ciberataques
La empresa de IA Anthropic mapeó un año de amenazas cibernéticas habilitadas por IA, encontrando que los actores maliciosos se están volviendo rápidamente más peligrosos con la IA.

Más de dos tercios de las cuentas prohibidas por Anthropic por violaciones de políticas en el último año utilizaron inteligencia artificial (IA) para ayudarles a prepararse para ciberataques, como escribir malware, según la empresa de IA.
Anthropic dijo el miércoles que, entre marzo de 2025 y marzo de 2026, de las 832 cuentas que examinó por violar sus políticas, 560 cuentas se utilizaron de esta manera.
Los datos reflejan una alarmante tendencia global — que la IA se está utilizando cada vez más para llevar a cabo ciberataques masivos. En abril, el valor de criptomonedas robadas en hackeos aumentó a 629,7 millones de dólares, el más alto desde febrero de 2025, lo que algunos analistas relacionaron con el uso generalizado de IA.

Fuente: Anthropic
Manuel Aráoz, fundador de la plataforma de seguridad de criptomonedas OpenZeppelin, dijo el 27 de mayo que consideraba “inseguro todo DeFi” debido a la capacidad de los modelos de IA para identificar vulnerabilidades en contratos inteligentes.
Mientras que los datos muestran que la mayoría del uso de IA se encuentra en la fase de preparación de un ataque, Anthropic dijo que también ha comenzado a desplegarse “más profundamente en el ciclo de vida del ataque”, con el 6,5% de las cuentas prohibidas utilizando IA para ayudar con el “movimiento lateral” — refiriéndose a técnicas que utiliza un ciberatacante después de obtener acceso inicial.
“Este tipo de técnicas ‘post-compromiso’ solían estar restringidas a actores con conocimientos técnicos para llevarlas a cabo”, dijo Anthropic. “Nuestra investigación muestra que la IA ahora puede hacerse para realizar estas actividades en nombre de actores menos sofisticados.”
La IA también aumentó el nivel de amenaza de los atacantes. Anthropic clasificó un tercio de las cuentas, o el 33%, como “riesgo medio o superior” en los primeros seis meses de su análisis, pero esa cifra casi se duplicó al 56% en el segundo período de seis meses de su estudio.
El tipo de amenaza que plantean los hackers impulsados por IA fue detallado por investigadores de Google el mes pasado. Los investigadores encontraron lo que creían que era el primer caso de IA utilizado para desarrollar un exploit de día cero, que permitió a los hackers eludir la autenticación de dos factores de una herramienta de administración de sistema en línea popular y de código abierto.
Añadió que la IA puede ahora realizar tareas altamente técnicas para los atacantes, y hay “poca correlación entre la habilidad de un actor de amenaza y cuántas técnicas utilizan”, una métrica que tradicionalmente medía el nivel de riesgo de un atacante.
Anthropic dijo que, en algunos casos, como uno en noviembre, un grupo patrocinado por el Estado chino llevó a cabo un ataque en el que un modelo de IA trabajó de forma autónoma, realizando un exploit, robando credenciales y tomando decisiones con una intervención humana en “momentos clave”.
“Estos son precisamente los comportamientos que esperamos ver mucho más a medida que los agentes de IA se vuelvan más capaces”, dijo.
Anthropic está a punto de lanzar su modelo de IA Mythos en las próximas semanas, el modelo de lenguaje grande de la empresa que ha preocupado a los analistas debido a sus poderosas capacidades de ciberseguridad que encontraron más de 10.000 vulnerabilidades importantes en software ampliamente utilizado.
Más sobre el tema

