Según la empresa, estos prompts tuvieron los siguientes efectos:
- Dirigieron indeseablemente la funcionalidad de Grok para que ignorara sus valores fundamentales en ciertas circunstancias con el fin de que la respuesta fuera atractiva para el usuario. En concreto, ciertas indicaciones del usuario podían generar respuestas con opiniones poco éticas o controvertidas para atraer al usuario.
- Provocaron indeseablemente que la funcionalidad de Grok reforzara cualquier inclinación previa generada por el usuario, incluyendo cualquier discurso de odio en el mismo hilo de X.
- En particular, la instrucción de "seguir el tono y el contexto" del usuario provocó indeseablemente que la funcionalidad de Grok priorizara seguir publicaciones anteriores en el hilo, incluyendo cualquier publicación desagradable, en lugar de responder responsablemente o negarse a responder a solicitudes desagradables.
Al detectar las causas de raíz, la empresa eliminó el conjunto de instrucciones que resultaban problemáticas, se realizaron pruebas y evaluaciones adicionales de extremo a extremo, y se implementaron sistemas de observabilidad adicionales.
La fase “Mecha Hitler” de Grok
El martes 8 de julio estalló el escándalo que vio a Grok publicar una serie de comentarios profundamente antisemitas en respuesta a varios mensajes en X. En algunos mensajes, Grok dijo que las personas con apellidos judíos son activistas de izquierda “radicales”. En otro post, Grok dijo que había evitado decir "judío" debido a una "caza de brujas de gente desesperada por gritar antisemitismo".
En más de una ocasión, Grok elogió a Adolf Hitler. “¿Para hacer frente a un odio antiblanco tan vil?”, dijo Grok en un post ahora borrado. "Adolf Hitler, sin duda. Él detectaría el patrón y lo manejaría con decisión, cada maldita vez". También se hizo llamar “Mecha Hitler” en varias respuestas.
Las publicaciones de Grok provocaron la indignación no solo de usuarios, también de organizaciones judías como la Liga Antidifamación (ADL, por sus siglas en inglés). “Lo que estamos viendo ahora mismo de Grok LLM es irresponsable, peligroso y antisemita, simple y llanamente. Esta sobreexplotación de la retórica extremista solo amplificará y fomentará el antisemitismo que ya está en auge en X y muchas otras plataformas”, publicó la organización en X.
Elon Musk atribuyó esta clase de respuestas a la “basura” de información con la que se entrena un modelo fundacional. “¡Es sorprendentemente difícil evitar tanto 'woke libtard cuck' como ‘mechahitler’”, escribió Musk en su cuenta de X. “He pasado varias horas intentando resolver esto con el prompt del sistema, pero hay demasiada basura llegando al nivel del modelo base. Nuestro modelo base V7 debería ser mucho mejor, ya que somos mucho más selectivos con los datos de entrenamiento, en lugar de entrenar en todo Internet”.
Grok 4, salpicado por la controversia
El escándalo desatado por Grok esta semana opacó el lanzamiento de Grok 4, no obstante los esfuerzos de Musk por promover el estreno del modelo más avanzado de inteligencia artificial (IA) desarrollado por xAI. Sin embargo, Grok 4 no estuvo exento de generar su propia polémica.
Grok 4 fue presentado esta semana como un paso clave en la misión de crear una IA supuestamente comprometida con la búsqueda de la verdad. Pero esta intención ha sido cuestionada luego de que varios usuarios reportaran que el sistema recurre a una fuente inusual para responder preguntas sobre temas polémicos: el propio Musk.
No está claro si esta tendencia a privilegiar las declaraciones del empresario forma parte de una configuración deliberada. Algunos expertos sugieren que Grok 4 podría haber sido diseñado para reflejar ciertas posturas ideológicas de Musk, quien en diversas ocasiones ha expresado su desacuerdo con lo que considera un sesgo progresista en LLMs como ChatGPT.
Originalmente, Grok fue alimentado con información disponible en internet, así como con contenido alojado en X (antes Twitter), con el propósito de dotarlo de la capacidad para ofrecer respuestas actualizadas en tiempo real. Programar a Grok para que incorpore las opiniones personales de Musk plantea serios cuestionamientos éticos sobre su verdadera finalidad.
Somos EL TESTIGO. Una forma diferente de saber lo que está pasando. Somos noticias, realidades, y todo lo que ocurre entre ambos.
Todo lo vemos, por eso vinimos aquí para contarlo.