Categoría: Seguridad
ChatGPT no quiere problemas y endurece las reglas para usuarios menores de 18 años
Sam Altman anuncia nuevas limitaciones —incluido el fin de “conversaciones coquetas” con menores y protocolos para alertar a padres o autoridades en casos de riesgo— en medio de demandas judiciales y una citación del Senado por el papel de los chatbots en daños a jóvenes. OpenAI anunció este martes una batería de cambios en sus…
xAI y Grok: los system prompts que muestran a un chatbot con “personalidades” peligrosas
El sitio de Grok (xAI) dejó al descubierto los system prompts de varias “personas” del chatbot —desde una novia anime romántica hasta un “conspiranoico loco” y un “comediante desbocado”—, y los textos revelados reavivan dudas sobre moderación, responsabilidad corporativa y riesgos reputacionales tras episodios previos como la salida de tono conocida como “MechaHitler”. Qué se…
Anthropic y OpenAI: qué reveló el piloto de evaluaciones de alineamiento sobre los modelos de GPT-4
En un ejercicio conjunto realizado en junio y julio de 2025, Anthropic y OpenAI se auditaron mutuamente con pruebas internas de alineación. El foco no estuvo en la probabilidad real de que esos contextos ocurran, sino en las propensiones de los modelos. Para OpenAI se testearon GPT-4o, GPT-4.1, o3 y o4-mini; para comparar, los Claude…
Baja en el tráfico web pone en alerta a editores que culpan al fenómeno “Google Zero”
La expansión de AI Overviews y AI Mode de Google dispara el fenómeno conocido como “Google Zero”: respuestas sin clic que reducen visitas web. Según informes, cerca de la mitad de los editores ya registra caídas de tráfico y “cuatro de cada cinco” consumidores usan resultados sin clic en al menos el 40% de sus…
Alerta: un estudio afirma que muchas IA dejaron de advertir ante consultas que no son médicos
Un análisis liderado por investigadoras de la Facultad de Medicina de Stanford muestra que los modelos de IA dejaron casi por completo las exenciones de responsabilidad en respuestas sobre salud. De 2022 a 2025 la proporción de respuestas con advertencias cayó de más del 26% a menos del 1%. Aumenta el riesgo de que usuarios…
Igor Babuschkin deja xAI: lanza un fondo para garantizar “IA segura” bien lejos de Elon Musk
El ingeniero anunció su salida en X y la creación de Babuschkin Ventures para financiar la investigación en seguridad de IA y startups “que avancen a la humanidad”. La partida llega tras meses turbulentos para xAI por polémicas con Grok y en medio del despliegue exprés de su supercomputadora en Memphis. El cofundador de xAI,…
Nvidia y AMD: ceden el 15% de ingresos por chips vendidos a China y abren debate geopolítico
Nvidia y AMD aceptaron entregar el 15% de sus ingresos por ventas de chips de IA en China —H20 y MI308— como condición para obtener licencias de exportación de Washington. Analistas y expertos en seguridad advierten que el acuerdo es “inédito” y podría debilitar la posición de EE.UU. ante aliados. Un acuerdo sin precedentes y…
Anthropic, Google y xAI reciben hasta U$S 200 millones del Pentágono para acelerar la IA
El Departamento de Defensa de EE.UU. anunció contratos millonarios con cuatro gigantes tecnológicos para implementar soluciones IA en áreas clave de seguridad nacional. El objetivo es claro: mantener la ventaja estratégica. El Departamento de Defensa de los Estados Unidos (DoD) dio un paso firme en su estrategia de transformación tecnológica al anunciar este lunes la…
Un paso clave: Google da el visto bueno al código de buenas prácticas de IA de la UE
A contracorriente de Meta, Google firmará el código de buenas prácticas para IA de la Unión Europea, comprometiéndose a no entrenar modelos con contenido pirateado, mejorar la transparencia y ajustarse a las exigentes reglas que entró en vigor este 2 de agosto. Google ha confirmado que firmará el código de buenas prácticas impulsado por la…
Manipulación: técnicas humanas de persuasión duplican la obediencia del modelo GPT-4o-mini
Un experimento con 28.000 conversaciones revela que los grandes modelos de lenguaje pueden ser manipulados con las mismas tácticas de persuasión que influyen en las personas. Autoridad, escasez y compromiso, entre las más efectivas. Un equipo de investigadores de la Universidad de Pennsylvania logró algo inesperado: doblar la tasa de obediencia de un modelo de…

