La startup británica, en colaboración con Arm, presenta un modelo de inteligencia artificial capaz de generar audio en tiempo real en dispositivos móviles, marcando un hito en la accesibilidad y eficiencia de la creación sonora.
En un movimiento que podría redefinir la creación de contenido sonoro en dispositivos móviles, Stability AI ha anunciado el lanzamiento de Stable Audio Open Small, un modelo de inteligencia artificial diseñado para generar muestras de audio directamente desde smartphones y otros dispositivos con procesadores Arm.
Este avance promete democratizar el acceso a herramientas de generación de audio, eliminando la dependencia de servicios en la nube y permitiendo la creación de sonidos en tiempo real y sin conexión.
Colaboración estratégica con Arm
La alianza entre Stability AI y Arm ha sido clave para optimizar el rendimiento del modelo en dispositivos móviles. Stable Audio Open Small cuenta con 341 millones de parámetros y ha sido específicamente ajustado para funcionar eficientemente en CPUs Arm, comunes en la mayoría de los smartphones y tablets actuales.
Según la compañía, el modelo puede generar hasta 11 segundos de audio en menos de 8 segundos en un teléfono inteligente, lo que representa una mejora significativa en términos de velocidad y eficiencia .
Entrenamiento ético y enfoque en la legalidad
A diferencia de otras aplicaciones de generación de audio que han enfrentado críticas por utilizar contenido protegido por derechos de autor en su entrenamiento, Stability AI asegura que su modelo fue entrenado exclusivamente con canciones de bibliotecas de audio libres de regalías, como Free Music Archive y Freesound.
Esta decisión busca minimizar riesgos legales y promover prácticas éticas en el desarrollo de tecnologías de inteligencia artificial .
Limitaciones actuales y perspectivas futuras
Si bien Stable Audio Open Small representa un avance notable, el modelo presenta algunas limitaciones. Actualmente, solo admite comandos en inglés y no es capaz de generar voces realistas ni canciones de alta calidad.
Además, su rendimiento varía según el estilo musical, debido a un sesgo hacia datos de entrenamiento occidentales. Stability AI reconoce estas restricciones y trabaja en mejorar la versatilidad y calidad del modelo en futuras actualizaciones .
Modelo de negocio y acceso
El acceso a Stable Audio Open Small es gratuito para investigadores, aficionados y empresas con ingresos anuales inferiores a U$S 1 millón. Sin embargo, las organizaciones que superen este umbral deben adquirir una licencia empresarial para utilizar el modelo. Esta estrategia busca fomentar la adopción de la tecnología en comunidades creativas y académicas, al tiempo que establece un modelo de monetización sostenible para la empresa .
Contexto empresarial de Stability AI
Este lanzamiento se produce en un momento crucial para Stability AI, que ha enfrentado desafíos financieros y de gestión en los últimos años. Tras una serie de controversias y la salida de su cofundador Emad Mostaque, la empresa ha buscado reestructurarse y recuperar la confianza de inversores y socios. La incorporación de figuras destacadas, como el cineasta James Cameron en su junta directiva, y el desarrollo de nuevos modelos de generación de imágenes y audio, forman parte de esta estrategia de revitalización .
Stable Audio Open Small marca un paso significativo hacia la integración de herramientas de inteligencia artificial en dispositivos móviles, ofreciendo a creadores y desarrolladores la posibilidad de generar contenido sonoro de manera rápida, eficiente y ética. Aunque aún presenta limitaciones, su lanzamiento refleja el compromiso de Stability AI con la innovación accesible y la expansión de las capacidades creativas en el ámbito digital.