What's in AI - #55
Tu dosis semanal de Inteligencia Artificial 🤖 Por Abilio Romero y Juan Águila.
El 4 de abril de 1975 se fundó Microsoft, una compañía que no solo revolucionó la computación personal, sino que también ha sido clave en la historia reciente de la inteligencia artificial.
Esto ha sido en parte por su alianza con OpenAI, pero también por cómo ha sido pionera en la integración de soluciones de inteligencia artificial en diversos sectores y productos con soluciones que han revolucionado industrias completas. Desde GitHub Copilot hasta todo su portfolio de productos en Azure, está claro que Microsoft ha sabido surfear la ola de la IA.
Curiosamente, el 1 de abril del año siguiente, 1976, nació Apple Inc., una organización con una visión innovadora que transformaría la forma en que interactuamos con la tecnología, y que fue pionera en la introducción de dispositivos “inteligentes”.
Casi 50 años más tarde, está claro que Apple no está teniendo la habilidad de otros para navegar en los mares de la inteligencia artificial, pero también que, si hay una organización que sabe de desarrollo de producto, esa es Apple.
Nosotros estamos deseando ver qué nos traen estos dos gigantes en los próximos meses, ¿y tú?
Esta semana en WIAI…
🚀📊 Google presenta sus nuevos modelos de razonamiento, Gemini 2.5
🖼️🎨 OpenAI integra generación de imágenes en GPT-4o
🔥💻 OpenAI limita la generación de imágenes en ChatGPT por sobrecarga de GPUs
💰🤖 Elon Musk fusiona xAI y X en un acuerdo millonario
📚 Junto con otras noticias interesantes sobre IA
No te pierdas nada
🚀📊 Google presenta sus nuevos modelos de razonamiento, Gemini 2.5
Google acaba de presentar su modelo más avanzado, Gemini 2.5, que mejora notablemente su capacidad para procesar tareas paso a paso, lo que permite una toma de decisiones más informada. Esta mejora en el razonamiento hace que los modelos puedan manejar problemas más complejos, ofreciendo respuestas más precisas y relevantes.
Además de procesar texto, los Gemini interpreta audio, imágenes estáticas, video y código, lo que incrementa su versatilidad. Con una ventana de contexto de 1 millón de tokens (2 millones de tokens próximamente), estos modelos podrán manejar mayores volúmenes de datos, permitiendo aplicaciones más potentes.
Según Google, el modelo Gemini 2.5 Pro lidera en benchmarks clave, superando a competidores como OpenAI y Anthropic. Este avance se destaca especialmente en áreas como razonamiento multimodal, programación y habilidades STEM (ciencia, tecnología, ingeniería y matemáticas).
🖼️🎨 OpenAI integra generación de imágenes en GPT-4o
OpenAI ha incorporado la generación de imágenes directamente en su modelo GPT-4o, reemplazando la integración anterior con DALL-E. Esta función permite a los usuarios crear imágenes realistas y detalladas a partir de descripciones textuales dentro del chat.
GPT-4o procesa texto e imágenes de manera conjunta, logrando resultados más precisos. Es capaz de manejar hasta 20 objetos diferentes simultáneamente, manteniendo relaciones correctas entre ellos, lo que facilita la creación de infografías, logotipos y otros contenidos visuales complejos.
Aunque la nueva función ofrece mayor libertad creativa, OpenAI ha implementado restricciones para evitar la generación de contenido nocivo, incluyendo deepfakes, violencia y representaciones no autorizadas de personas reales. Además, se ha añadido metadatos C2PA a todas las imágenes generadas, identificándolas claramente como creadas por IA.
La facilidad para replicar estilos protegidos por derechos de autor ha generado preocupaciones legales. Aunque la imitación de estilos no está explícitamente protegida, expertos señalan que si OpenAI entrenó su modelo utilizando obras de estudios como Ghibli sin permiso, podría haber implicaciones legales.
🔥💻 OpenAI limita la generación de imágenes en ChatGPT por sobrecarga de GPUs
La reciente función de generación de imágenes en ChatGPT, que permite crear ilustraciones al estilo de Studio Ghibli, ha generado una demanda tan alta que ha sobrecargado las unidades de procesamiento gráfico (GPU) de OpenAI. El CEO, Sam Altman, comentó que las GPUs están "derritiéndose" debido al uso intensivo.
Para gestionar la carga y mejorar la eficiencia, OpenAI ha introducido límites en la cantidad de imágenes que los usuarios pueden generar. Aunque no se especificaron los detalles exactos, se mencionó que los usuarios gratuitos de ChatGPT podrán generar hasta tres imágenes por día.
El alto consumo energético asociado con la generación de imágenes ha levantado preocupaciones sobre la sostenibilidad de la IA. Los centros de datos requieren soluciones de refrigeración intensivas, lo que plantea desafíos ambientales que OpenAI y otras empresas tecnológicas deben abordar.
💰🤖 Elon Musk fusiona xAI y X en un acuerdo millonario
Elon Musk ha integrado su empresa de inteligencia artificial, xAI, con la plataforma de redes sociales X (anteriormente Twitter) en una transacción totalmente en acciones. Esta operación valora a xAI en 80.000 millones de dólares y a X en 33.000 millones, considerando una deuda de 12.000 millones.
La fusión busca combinar las avanzadas capacidades de IA de xAI con la amplia base de usuarios de X. Se espera que esta integración potencie experiencias más inteligentes y significativas para los usuarios, aprovechando datos y modelos compartidos.
Desde la adquisición de Twitter en 2022, Musk ha implementado cambios significativos en X, incluyendo modificaciones en políticas y estructura. La reciente fusión con xAI refuerza su visión de transformar X en una "superaplicación" que combine redes sociales y servicios de IA.
🧠🔄 OpenAI reestructura su liderazgo: Brad Lightcap al mando de operaciones y Sam Altman enfocado en tecnología
OpenAI ha anunciado cambios significativos en su estructura directiva. Sam Altman, CEO de la empresa, redirige su atención hacia la dirección técnica, abarcando investigación y desarrollo de productos. Mientras tanto, Brad Lightcap, previamente Director de Operaciones (COO) y Finanzas, amplía su rol para supervisar las operaciones diarias, expansión internacional y gestionar alianzas estratégicas con gigantes tecnológicos como Microsoft y Apple.
Mark Chen ha sido ascendido a Director de Investigación (CRO), con la responsabilidad de impulsar avances científicos y garantizar la integración entre investigación y desarrollo de productos. Julia Villagra asume el cargo de Directora de Personal (CPO), enfocándose en la cultura organizacional y en atraer talento clave para el crecimiento global de OpenAI.
Estos ajustes se producen tras la transformación de OpenAI de una organización sin fines de lucro a una entidad con fines de lucro, un movimiento que ha generado debates sobre su misión original.
Si tienes ganas de mas…
Anthropic's "AI microscope" reveals how Claude plans ahead when generating poetry
OpenAI thinks its revenue will more than triple in 2025, report says
Google quantum exec says tech is ‘5 years out from a real breakout’
Apple explores adding AI cameras to Apple Watch and AirPods
Google is rolling out Gemini’s real-time AI video features
Satya Nadella: DeepSeek is the new bar for Microsoft’s AI success
🎁 Bonus track
La oleada de imágenes al estilo Studio Ghibli nos deja algunas preocupaciones sobre la protección de derechos, pero también un montón de instantáneas espectaculares de las fotografías más famosas de la historia reconvertidas en animación. Aquí van algunas de nuestras favoritas!
Y si te ha gustado la publicación, ¡no olvides compartirla!
Y si aún no estas suscrito, ¿a qué esperas? 😉
Déjanos tu opinión: