Taalas apuesta a reinventar la IA: personalizar chips para eliminar el mayor problema de la IA

La startup deep-tech Taalas presentó una nueva arquitectura de hardware capaz de ejecutar modelos de inteligencia artificial hasta 10 veces más rápido, 20 veces más barata y con 10 veces menos consumo energético. Su objetivo: hacer realidad la IA ubicua.

Mientras el mundo tecnológico avanza hacia una adopción masiva de inteligencia artificial, aparece una paradoja cada vez más evidente: la IA ya supera al ser humano en múltiples tareas específicas, pero aún no puede integrarse plenamente en la vida cotidiana.

El motivo no es conceptual ni científico. Es industrial.

Dos obstáculos frenan la expansión real de la inteligencia artificial: la latencia y el costo extremo de operación.

Ahí es donde entra en escena Taalas, una joven compañía deep-tech fundada hace poco más de 30 meses, que propone un cambio radical en la manera en que se construyen y ejecutan los modelos de IA.

El verdadero cuello de botella de la inteligencia artificial

Hoy, desplegar modelos avanzados exige infraestructuras gigantescas: supercomputadoras del tamaño de habitaciones completas que consumen cientos de kilovatios, requieren refrigeración líquida, empaquetado avanzado, memorias apiladas y kilómetros de cableado.

Este modelo escala hacia centros de datos del tamaño de ciudades y redes satelitales, elevando los costos operativos a niveles astronómicos.

Además, existe otro problema menos visible: la velocidad de interacción.

Los asistentes de programación impulsados por IA pueden tardar minutos en responder, rompiendo el flujo cognitivo del desarrollador. Sin embargo, las aplicaciones autónomas basadas en agentes requieren latencias de milisegundos para funcionar correctamente.

Según la visión de Taalas, la historia tecnológica demuestra que estas etapas iniciales siempre terminan siendo reemplazadas por soluciones más simples y eficientes. El paralelismo es claro: así como la computadora ENIAC —un sistema enorme basado en tubos de vacío— fue reemplazada por el transistor y luego por las PCs y smartphones, la inteligencia artificial necesita su propia transición hacia eficiencia masiva.

Convertir modelos de IA en hardware

La propuesta central de Taalas consiste en transformar cualquier modelo de inteligencia artificial directamente en silicio personalizado.

Desde el momento en que la empresa recibe un modelo nuevo, puede materializarlo en hardware dedicado en apenas dos meses.

El resultado son los llamados Hardcore Models, sistemas que —según la compañía— son:

10 veces más rápidos
20 veces más baratos de construir
10 veces más eficientes energéticamente

El enfoque se basa en tres principios técnicos.

1. Especialización total

Taalas sostiene que la inferencia de IA es el workload computacional más crítico jamás enfrentado por la humanidad. En lugar de usar hardware generalista, propone diseñar chips óptimos para cada modelo específico.

2. Unificar memoria y cómputo

El hardware actual separa memoria y procesamiento, generando cuellos de botella masivos. La arquitectura de Taalas elimina esa división integrando almacenamiento y cálculo en un solo chip con densidad comparable a DRAM.

Esto permite evitar tecnologías complejas como:

memorias HBM,
empaquetado avanzado,
stacking 3D,
refrigeración líquida,
interfaces de alta velocidad.

3. Simplificación radical

Al rediseñar todo el stack desde cero, la compañía afirma haber logrado una reducción de costos de un orden de magnitud completo.

El primer producto: Silicon Llama

El debut comercial llega con el Taalas HC1, una placa de inferencia dedicada al modelo abierto Llama 3.1 8B.

La empresa eligió este modelo por su tamaño práctico y disponibilidad open source, permitiendo acelerar su implementación.

El resultado técnico es contundente:

17.000 tokens por segundo por usuario
casi 10 veces más rápido que el estado del arte actual
20 veces menos costo de construcción
10 veces menor consumo energético

El sistema mantiene flexibilidad mediante ventanas de contexto configurables y ajuste fino utilizando adaptadores LoRA.

La primera generación utilizó un formato propietario de 3 bits, combinando parámetros de 3 y 6 bits, lo que introduce ligeras degradaciones frente a benchmarks GPU. La segunda generación adoptará formatos estándar de 4 bits flotantes para mejorar la calidad sin sacrificar eficiencia.

La hoja de ruta: razonamiento y modelos frontier

Taalas confirmó que su próximo lanzamiento será un modelo de razonamiento de tamaño medio, actualmente en desarrollo y previsto para integrarse al servicio de inferencia durante la primavera del hemisferio norte.

Posteriormente llegará un modelo frontier construido sobre la nueva plataforma HC2, que ofrecerá mayor densidad y velocidad, con despliegue planificado para el invierno.

La estrategia es clara: liberar sistemas tempranamente para que los desarrolladores experimenten con inteligencia artificial de latencia casi nula y costo cercano a cero.

Una startup pequeña contra el modelo Big Tech

Uno de los datos más llamativos del anuncio es el tamaño del equipo.

El primer producto fue desarrollado por solo 24 personas, con un gasto total de U$S 30 millones, pese a que la empresa recaudó más de U$S 200 millones en financiamiento.

Taalas define su enfoque como un “ataque de precisión” frente a startups deep-tech que operan con enormes plantillas, grandes rondas de capital y altos niveles de hype.

La compañía afirma priorizar:

sustancia sobre espectáculo,
ingeniería sobre escala,
rigor técnico sobre expansión acelerada.

El camino hacia una IA ubicua

El mensaje estratégico detrás del lanzamiento es ambicioso.

Para Taalas, la inteligencia artificial no será verdaderamente transformadora mientras dependa de infraestructuras gigantescas y costos prohibitivos. La IA generalizada llegará solo cuando sea rápida, barata y fácil de desplegar, tal como ocurrió con la computación personal.

Al eliminar latencia y costo —los dos grandes límites actuales— la empresa busca habilitar una nueva generación de aplicaciones que hoy simplemente no son viables.

La apuesta es profunda: cambiar no el modelo de IA, sino el paradigma industrial completo sobre el cual se construye.

Si la tesis resulta correcta, el futuro de la inteligencia artificial podría no estar en centros de datos cada vez más grandes, sino en chips especializados capaces de llevar inteligencia instantánea directamente a las manos de los desarrolladores.

Colección de categorías

Taalas apuesta a reinventar la IA: personalizar chips para eliminar el mayor problema de la IA

La startup deep-tech Taalas presentó una nueva arquitectura de hardware capaz de ejecutar modelos de inteligencia artificial hasta 10 veces más rápido, 20 veces más barata y con 10 veces menos consumo energético. Su objetivo: hacer realidad la IA ubicua.

El verdadero cuello de botella de la inteligencia artificial