What's in AI - #17
Tu dosis semanal de Inteligencia Artificial 🤖 Por Abilio Romero y Juan Águila.
El 9 de junio de 2011 la ONU declara el acceso a Internet como un derecho humano, subrayando la importancia de la conectividad para el desarrollo y la libertad de expresión. En España, el artículo 81 de la Ley Orgánica 3/2018 garantiza el derecho de acceso universal a Internet.
Internet es si duda un antes y un después para la humanidad, ¿será el acceso a la IA alguna vez tan diferencial como para convertirse en un derecho universal? ¿o será el privilegio de unos pocos?
Esta semana en WIAI…
🎶🔊 Stability AI lanza Stable Audio Open
🚀📊 Alibaba publica Qwen2, su LLM mas avanzado hasta la fecha
🖼️🗣️ Google publica PaliGemma, un modelo open source de visión-lenguaje (VLM)
🎥🤖 Kling, el nuevo modelo open source para generación de vídeo que rivaliza con Sora
📚 Junto con otras noticias interesantes sobre IA
No te pierdas nada
🎶🔊 Stability AI lanza Stable Audio Open
Stable Audio Open es un modelo open source para generar hasta 47 segundos de muestras de audio y efectos de sonido a partir de texto.
Ideal para crear ritmos de batería, riffs de instrumentos, sonidos ambientales y elementos de producción. Los usuarios pueden ajustar el modelo con sus propios datos de audio.
Entrenado con datos de Freesound y Free Music Archive, está disponible en Hugging Face para diseñadores de sonido, músicos y desarrolladores.
🚀📊 Alibaba publica Qwen2, su LLM mas avanzado hasta la fecha
Qwen2 incluye modelos preentrenados y ajustados por instrucciones en cinco tamaños: Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B y Qwen2-72B. Estos modelos han sido entrenados en 27 idiomas adicionales además del inglés y el chino, mostrando un rendimiento superior en múltiples evaluaciones comparativas.
Los modelos han mejorado significativamente en áreas como codificación, matemáticas y comprensión de contextos largos (hasta 128K tokens). Además, Qwen2-72B supera a modelos líderes como Llama-3-70B y a su predecesor Qwen1.5-110B.
Qwen2-72B-Instruct demuestra un rendimiento comparable al de GPT-4 en seguridad, superando al modelo Mistral-8x22B en respuestas seguras para consultas multilingües.
Qwen2 es open source, disponible para cualquiera en Hugging Face
🖼️🗣️ Google publica PaliGemma, un modelo open source de visión-lenguaje (VLM)
PaliGemma es un modelo de visión y lenguaje inspirado en PaLI-3, capaz de analizar imágenes y texto simultáneamente, proporcionando respuestas detalladas sobre el contenido visual.
Incluye un conjunto de modelos de propósito general, que se pueden afinar para varias tareas, y un conjunto orientado a la investigación, ajustado en conjuntos de datos específicos.
El modelo esta disponible para cualquiera en HuggingFace y Kaggle.
🎥🤖 Kling, el nuevo modelo open source para generación de vídeo que rivaliza con Sora
Kuaishou, empresa tecnológica china, lanzó KLING, un generador de videos con IA que produce videos de hasta dos minutos en resolución 1080p y 30 fps, compitiendo con OpenAI Sora.
KLING puede modelar secuencias de movimiento complejas con precisión física utilizando un sistema de atención espacio-temporal 3D y un "transformador de difusión" para crear escenas ficticias.
KLING está disponible como demo pública en China y se destaca por la generación de videos de alta resolución y escenas físicas realistas.
📈💻 Nvidia ha superado a Apple en valoración de mercado, convirtiéndose en la segunda empresa más valiosa del mundo, solo detrás de Microsoft
Nvidia ha superado a Apple en capitalización de mercado, alcanzando los 3.014 billones de dólares, solo por detrás de Microsoft, que se sitúa en 3.15 billones. Apple, que antes era la compañía más valiosa, ha visto estancada su valoración mientras los inversores esperan su estrategia en IA.
El crecimiento meteórico de Nvidia está directamente relacionado con el auge de la inteligencia artificial. La empresa ha experimentado un aumento del 146% en el valor de sus acciones este año, impulsado por la creciente demanda de sus GPUs que facilitan el desarrollo de IA avanzada.
Si tienes ganas de mas…
El nuevo 'compañero de IA' de Asana puede decirle a la gente qué hacer en el trabajo
🎁 Bonus track
¿Simular una empresa donde todos los empleados son chatgpt y que diseñen su propio videojuego? ¿Simular un hospital gestionado por IA? En este entretenido vídeo de Two Minute Papers nos enseñan dos papers realmente interesantes sobre este tipo de simulaciones con LLM agents:
Y si te ha gustado la publicación, ¡no olvides compartirla!
Y si aún no estas suscrito, ¿a qué esperas? 😉
Déjanos tu opinión: