What's in AI - #51
Tu dosis semanal de Inteligencia Artificial 🤖 Por Abilio Romero y Juan Águila.
El 3 de marzo de 1847 nació en Edimburgo Alexander Graham Bell, la primera persona que patentó el teléfono en 1876.
Su trabajo en acústica y telecomunicaciones sentó las bases de la comunicación moderna, facilitando la evolución de tecnologías que hoy integran inteligencia artificial, como asistentes de voz y sistemas de reconocimiento de audio. Además, Bell cofundó la National Geographic Society y realizó innovaciones en aeronáutica y dispositivos para mejorar la audición, demostrando una visión que trascendió más allá del teléfono.
Lo curioso, por llamarlo de alguna forma, es que el teléfono fue inventado realmente por el italiano Antonio Meucci, a quien Estados Unidos reconoció en 2002, mas de 120 años después.
Esta semana en WIAI…
⚡✨ GPT-4.5: el nuevo gigante (pero no “frontera”) de OpenAI
🔥🧩 Claude 3.7 Sonnet: el “razonamiento híbrido” más avanzado de Anthropic
⚡️✨ Alexa+: Amazon reinventa el asistente de voz con IA generativa
🕵️♂️🔎 Deep Research de OpenAI se expande a más usuarios
❤️✨ Comet: Perplexity presenta el futuro de los navegadores
🔥🚀 Google libera Gemini Code Assist: ¡IA de código gratuita con altos límites!
📚 Junto con otras noticias interesantes sobre IA
No te pierdas nada
⚡✨ GPT-4.5: el nuevo gigante (pero no “frontera”) de OpenAI
GPT-4.5 es el modelo más grande de OpenAI hasta la fecha, con mejoras en conocimiento y redacción. Sin embargo, la propia compañía aclara que no alcanza el nivel de “frontera” y su rendimiento es menor que el de modelos como o1 o o3-mini.
OpenAI destaca que GPT-4.5 escribe con mayor fluidez, mantiene conversaciones más naturales y reduce los errores conocidos como “alucinaciones” (datos falsos). La compañía logró esto gracias a nuevas técnicas de supervisión y métodos tradicionales (SFT y RLHF).
Aunque GPT-4.5 no promete romper récords en pruebas de rendimiento, sí allana el camino para GPT-5, que llegará —según Sam Altman— a finales de mayo con el nuevo modelo de razonamiento o3 integrado, buscando acercarse cada vez más a la inteligencia artificial general.
🔥🧩 Claude 3.7 Sonnet: el “razonamiento híbrido” más avanzado de Anthropic
Claude 3.7 Sonnet unifica razonamiento y tareas estándar (como responder preguntas simples o complejas) en un solo sistema, sin separar un “modelo de razonamiento” aparte. Esto agiliza la interacción y mejora su rendimiento en matemáticas, programación y temas legales.
Con Claude Code, Anthropic estrena una herramienta “agente” que puede buscar y leer código, editar archivos, crear y ejecutar pruebas, e incluso manejar GitHub y la línea de comandos, facilitando el flujo de trabajo de los desarrolladores.
El modelo admite “scratchpads” para definir cómo “piensa” y controlar el tiempo de respuesta. Además, Claude 3.7 está actualizado hasta octubre de 2024 y conserva el mismo coste de uso que la versión anterior, reforzando la tendencia de combinar todas las funciones en un único modelo de IA.
⚡️✨ Alexa+: Amazon reinventa el asistente de voz con IA generativa
Amazon ha presentado Alexa+, que utiliza tecnologías de IA generativa para responder preguntas más complejas y adaptarse a tus gustos, rutinas y dispositivos. Puede incluso revisar y comentar documentos, calendarios y correos, ofreciendo recordatorios y resúmenes personalizados.
Funciona con dispositivos Echo Show para mostrar galerías y paneles de control, y se conecta sin problemas a cámaras Ring, Fire TV y otros servicios. Así, Alexa+ puede resumir un video de seguridad, saltar a un punto exacto de una película o encender música en distintos dispositivos.
Gracias al “nuevo corazón” de Alexa, entiende entonación, ambiente y contexto para ajustar sus respuestas en tiempo real. Desde recomendar una pizzería cercana según tus gustos hasta reservar mesa o planificar viajes completos, Alexa+ aspira a ser un asistente más inteligente y empático.
🕵️♂️🔎 Deep Research de OpenAI se expande a más usuarios
Deep Research, antes reservado para suscriptores Pro (USD 200/mes), ahora llega a los planes Plus, Team, Edu y Enterprise de ChatGPT, ampliando el acceso a informes en profundidad.
Los usuarios Plus reciben 10 búsquedas al mes, mientras que los clientes Pro suben a 120. Además, ChatGPT ahora incluye imágenes junto a las citas y mejora la comprensión de tipos de archivo.
Dado que Deep Research requiere mucha potencia de cómputo, quienes usan ChatGPT Free tendrán que esperar: de momento, la herramienta solo está disponible para usuarios de pago.
❤️✨ Comet: Perplexity presenta el futuro de los navegadores
Perplexity planea lanzar “Comet”, su propio navegador web con funcionalidades de IA, en un intento por aprovechar la popularidad de su motor de búsqueda inteligente.
Fundada en 2022 y valorada en unos 9.000 millones de dólares, Perplexity maneja más de 100 millones de consultas semanales y cuenta con más de 500 millones de dólares en inversión, lo que podría darle ventaja para irrumpir en el competitivo mercado de los navegadores.
A pesar de su éxito, la startup enfrenta demandas de grandes editoriales como Dow Jones, por supuesta “apropiación” de contenidos. Este conflicto legal pone a prueba el modelo de negocio de Perplexity y su programa de compartir ingresos con los medios.
🔥🚀 Google libera Gemini Code Assist: ¡IA de código gratuita con altos límites!
Google acaba de liberar una nueva versión de su asistente de código, Gemini Code Assist, ofreciendo 180.000 autocompletados al mes (90 veces más que la versión gratuita de GitHub Copilot), además de 240 chats diarios y un contexto de 128.000 tokens para proyectos más grandes.
Funciona con VS Code, JetBrains y GitHub, revisando pull requests y buscando bugs, algo pensado para desenvolverse fácilmente en flujos de trabajo de desarrolladores.
Google quiere atraer a programadores desde el principio de su carrera para que más adelante adopten su versión empresarial, compitiendo directamente con GitHub Copilot y Microsoft en el mercado de herramientas de desarrollo impulsadas por IA.
Si tienes ganas de mas…
Alibaba offers free access to its AI model that can generate realistic video and images
Grok’s new “unhinged” voice mode can curse and scream, simulate phone sex
Meta in talks for $200 billion AI data center project, The Information reports
Ya sabemos para qué está utilizando la gente la IA realmente en el trabajo: para traducir textos
Cómo usar ChatGPT como buscador predeterminado en Chrome
🎁 Bonus track
En línea con la noticia sobre el anuncio de Clause Sonnet 3.7, os dejamos un breve story de DotCSV explicando lo mas destacable de este nuevo modelo:
Y si te ha gustado la publicación, ¡no olvides compartirla!
Y si aún no estas suscrito, ¿a qué esperas? 😉
Déjanos tu opinión: