Cointelegraph
Christina Comben
Escrito por Christina Comben,Redactor de plantilla
Bryan O'Shea
Revisado por Bryan O'Shea,Editor de plantilla

Eliminación de controles en modelos de IA abiertos expone los límites de su regulación

Pruebas realizadas por Financial Times encontraron que los controles de seguridad de modelos abiertos de IA de Meta y Google podían eliminarse en cuestión de minutos, lo que genera preocupaciones sobre gobernanza y seguridad.

Eliminación de controles en modelos de IA abiertos expone los límites de su regulación
Noticias

Las protecciones de seguridad en modelos de inteligencia artificial de código abierto desarrollados por grandes compañías tecnológicas pueden eliminarse en cuestión de minutos utilizando herramientas disponibles públicamente, permitiendo que los sistemas generen respuestas sobre temas como armas biológicas, malware y otros contenidos prohibidos, según pruebas realizadas por Financial Times junto con el grupo de seguridad en IA Alice.

Los hallazgos publicados el lunes aumentan las preocupaciones de que las salvaguardas integradas por los desarrolladores podrían no mantenerse una vez que los pesos de los modelos sean liberados y modificados, generando dudas sobre dónde debería recaer la responsabilidad de la seguridad en IA.

La investigación, realizada utilizando herramientas disponibles en repositorios públicos de código, encontró que las barreras de seguridad de modelos desarrollados por compañías como Meta y Google podían eliminarse en menos de 10 minutos sin necesidad de hardware especializado.

Las versiones modificadas de los sistemas pudieron posteriormente responder a prompts que los modelos originales rechazaban, incluidas solicitudes relacionadas con malware y riesgos químicos, según las pruebas.

Los resultados ponen de relieve un desafío para los reguladores a medida que los sistemas de código abierto se vuelven más capaces y ampliamente distribuidos.

A diferencia de los modelos propietarios, los sistemas open-source pueden descargarse, alterarse y redistribuirse fuera del control de sus desarrolladores originales, lo que dificulta la aplicación de restricciones de seguridad después de su lanzamiento y plantea interrogantes sobre si una regulación centrada principalmente en el desarrollo de modelos es suficiente.

Límites de gobernanza

Los reguladores globales están desarrollando marcos regulatorios para sistemas avanzados de IA, incluido el AI Act de la European Union y los enfoques emergentes sobre seguridad de modelos frontier en el Reino Unido y los Estados Unidos. Sin embargo, expertos afirman que los hallazgos revelan limitaciones en las actuales suposiciones de gobernanza.

Ley de IA de la Unión Europea. Fuente: European Commission

Markus Levin, cofundador de la empresa de redes de infraestructura física descentralizada XYO, dijo a Cointelegraph que la rápida eliminación de salvaguardas demuestra “qué tan rápido cambia el control una vez que los modelos abiertos son liberados”, añadiendo que la mayoría de propuestas de gobernanza todavía se enfocan demasiado en la etapa de construcción del modelo.

David Minarsch, miembro fundador de Olas y director ejecutivo de Valory, dijo a Cointelegraph que es poco probable que los gobiernos puedan impedir que actores decididos accedan o modifiquen modelos una vez que sus pesos se encuentren ampliamente replicados online. Señaló que la regulación sería más efectiva si se enfocara en el despliegue, la distribución y el uso dañino en el mundo real, en lugar de centrarse únicamente en la capa original de desarrolladores.

El control se desplaza aguas abajo

Ronghui Gu, director ejecutivo y cofundador de la firma de seguridad blockchain CertiK, dijo a Cointelegraph que la gobernanza en la capa de desarrolladores sigue siendo importante, pero se vuelve insuficiente una vez que los modelos pueden descargarse y redistribuirse libremente.

Gu afirmó que es más probable que los reguladores puedan influir en el hosting comercial, el despliegue empresarial y los canales de distribución que impedir por completo la propagación de modelos modificados.

También argumentó que los estándares de seguridad deben evolucionar para identificar comportamientos maliciosos o de alto riesgo en herramientas de IA de terceros y entornos autónomos de agentes de IA antes de su despliegue, con el objetivo de contener mejor las amenazas en tiempo de ejecución a medida que los agentes asumen roles más autónomos.

Levin afirmó que la contención se vuelve cada vez más difícil una vez que los modelos son replicados y redistribuidos, lo que significa que los reguladores podrían necesitar centrarse más en la infraestructura y los puntos de distribución, en lugar de enfocarse únicamente en el diseño de modelos.

Tanto Levin como Minarsch compararon el problema con el software de código abierto y las redes cripto, donde históricamente los intentos de frenar la distribución han resultado difíciles una vez que el código se vuelve público. Minarsch añadió que, aunque las capas de seguridad pueden desalentar el mal uso casual, no deben confundirse con una protección robusta frente a actores sofisticados.

Aclaración: La información y/u opiniones emitidas en este artículo no representan necesariamente los puntos de vista o la línea editorial de Cointelegraph. La información aquí expuesta no debe ser tomada como consejo financiero o recomendación de inversión. Toda inversión y movimiento comercial implican riesgos y es responsabilidad de cada persona hacer su debida investigación antes de tomar una decisión de inversión.

Cointelegraph está comprometido con un periodismo independiente y transparente. Este artículo de noticias se elabora de conformidad con la Política Editorial de Cointelegraph y tiene como objetivo proporcionar información precisa y oportuna. Se recomienda a los lectores verificar la información de manera independiente. Lea nuestra Política Editorial https://cointelegraph.es/editorial-policy