
Categoría: Seguridad

OpenAI despliega en ChatGPT un sistema de enrutamiento de seguridad y control parental
La compañía pone en marcha un router que remite conversaciones sensibles a variantes de mayor razonamiento (GPT-5-thinking) y lanza controles parentales para cuentas de adolescentes. La medida llega tras críticas por respuestas peligrosas y una demanda por la muerte de un joven; OpenAI dará 120 días para iterar el sistema. OpenAI anunció esta semana dos…

Petri: una herramienta pública que usa agentes para descubrir fallas críticas en modelos de IA
Petri automatiza auditorías de seguridad con “auditores” de IA y ya probó 111 instrucciones sobre 14 modelos de última generación, revelando desde engaños autónomos hasta cooperación con usos dañinos. Para empresas, es una invitación urgente a auditar antes de desplegar. La adopción masiva de modelos de inteligencia artificial plantea una pregunta estratégica para empresas y…

Anthropic y Imagine: cuando Claude empieza a construir la interfaz por sí misma
La demo Imagine transforma al asistente en un ensamblador de pantallas: ventanas, menús y apps generadas al vuelo por un agente llamado Heli. Es un experimento con potencial para redefinir cómo usamos software —y para obligar a empresas a repensar seguridad, gobernanza y experiencia de usuario. La pantalla inicial no es solo coquetería. Cuando Anthropic…

Cómo Corea del Sur encara una carrera de IA para derrotar a OpenAI y Google
Seúl destinó ₩530 billion (U$S 390 millones) a cinco jugadores —LG AI Research, SK Telecom, Naver Cloud, NC AI y Upstage— con el objetivo de crear modelos base locales. El plan prioriza eficiencia, datos nacionales y aplicaciones industriales por sobre la pura carrera de tamaño. Un plan soberano con calendario y tijera El Ministerio de…

La app Neon desaparece tras exponer números y grabaciones: quedó offline por una falla grave
Neon fue descargada 75.000 veces en un día y escaló al top-5 de apps gratis; TechCrunch halló que cualquier usuario podía acceder a números, audios y transcripciones de terceros, y el fundador, Alex Kiam, decidió desconectar los servidores. La promesa de Neon —pagar a usuarios por grabar llamadas para alimentar modelos de IA— se convirtió…

Microsoft y la gran prueba de la era de la IA
Satya Nadella admite temores sobre el futuro y promueve a líderes clave en Copilot y Windows. Microsoft atraviesa uno de sus momentos más decisivos desde su fundación hace más de medio siglo. En plena carrera global por el liderazgo en inteligencia artificial, Satya Nadella, director ejecutivo de la compañía, sorprendió a empleados y analistas al…

ChatGPT no quiere problemas y endurece las reglas para usuarios menores de 18 años
Sam Altman anuncia nuevas limitaciones —incluido el fin de “conversaciones coquetas” con menores y protocolos para alertar a padres o autoridades en casos de riesgo— en medio de demandas judiciales y una citación del Senado por el papel de los chatbots en daños a jóvenes. OpenAI anunció este martes una batería de cambios en sus…

xAI y Grok: los system prompts que muestran a un chatbot con “personalidades” peligrosas
El sitio de Grok (xAI) dejó al descubierto los system prompts de varias “personas” del chatbot —desde una novia anime romántica hasta un “conspiranoico loco” y un “comediante desbocado”—, y los textos revelados reavivan dudas sobre moderación, responsabilidad corporativa y riesgos reputacionales tras episodios previos como la salida de tono conocida como “MechaHitler”. Qué se…

Anthropic y OpenAI: qué reveló el piloto de evaluaciones de alineamiento sobre los modelos de GPT-4
En un ejercicio conjunto realizado en junio y julio de 2025, Anthropic y OpenAI se auditaron mutuamente con pruebas internas de alineación. El foco no estuvo en la probabilidad real de que esos contextos ocurran, sino en las propensiones de los modelos. Para OpenAI se testearon GPT-4o, GPT-4.1, o3 y o4-mini; para comparar, los Claude…

Baja en el tráfico web pone en alerta a editores que culpan al fenómeno “Google Zero”
La expansión de AI Overviews y AI Mode de Google dispara el fenómeno conocido como “Google Zero”: respuestas sin clic que reducen visitas web. Según informes, cerca de la mitad de los editores ya registra caídas de tráfico y “cuatro de cada cinco” consumidores usan resultados sin clic en al menos el 40% de sus…