Inicio » Tecnología » NVIDIA lanza Llama Nemotron Ultra: supera a DeepSeek R1 con la mitad de parámetros

NVIDIA lanza Llama Nemotron Ultra: supera a DeepSeek R1 con la mitad de parámetros

La compañía tecnológica presenta su nuevo modelo de lenguaje que promete revolucionar la inteligencia artificial con eficiencia y rendimiento sin precedentes.

En un movimiento estratégico para consolidar su liderazgo en el ámbito de la inteligencia artificial, NVIDIA ha presentado Llama Nemotron Ultra, un modelo de lenguaje de 253 mil millones de parámetros que, según la compañía, supera al reconocido DeepSeek R1, manteniendo solo la mitad de su tamaño.

Este avance refleja el compromiso de NVIDIA por ofrecer soluciones más eficientes y accesibles en el mercado de la IA.​

Basado en el modelo Llama 3.1 de Meta, Llama Nemotron Ultra ha sido optimizado mediante técnicas avanzadas de búsqueda de arquitectura neuronal (NAS). Estas optimizaciones incluyen la introducción de capas de atención omitidas y redes feedforward fusionadas, lo que permite reducir el consumo de memoria y las demandas computacionales sin comprometer la calidad de las respuestas generadas.

Gracias a estas mejoras, el modelo puede desplegarse eficientemente en configuraciones de GPU como la H100 de NVIDIA.

El proceso de post-entrenamiento de Llama Nemotron Ultra ha sido meticuloso, abarcando desde el ajuste supervisado en áreas como matemáticas, generación de código y uso de herramientas, hasta el aprendizaje por refuerzo con optimización de políticas relativas en grupo (GRPO).

Este enfoque ha permitido mejorar significativamente las capacidades de razonamiento y seguimiento de instrucciones del modelo, posicionándolo como una herramienta poderosa para aplicaciones empresariales y asistentes de IA.

La comunidad tecnológica ha recibido con interés este lanzamiento, especialmente considerando la creciente competencia en el sector de modelos de lenguaje de código abierto. La aparición de modelos como DeepSeek R1 había generado inquietudes en empresas establecidas, pero con Llama Nemotron Ultra, NVIDIA demuestra su capacidad para innovar y mantenerse a la vanguardia. ​

Con este desarrollo, NVIDIA no solo refuerza su posición en el mercado de la inteligencia artificial, sino que también ofrece a desarrolladores y empresas una herramienta robusta y eficiente para abordar tareas complejas de procesamiento de lenguaje natural.

La combinación de rendimiento superior y eficiencia en el uso de recursos convierte a Llama Nemotron Ultra en una opción atractiva para diversas aplicaciones en el ámbito de la IA.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

WP to LinkedIn Auto Publish Powered By : XYZScripts.com