What's in AI - #65
Tu dosis semanal de Inteligencia Artificial 🤖 Por Abilio Romero y Juan Águila.
Un lunes cualquiera, hace apenas ocho años, apareció en arXiv un artículo con cinco palabras que hoy suenan casi proféticas: “Attention Is All You Need”. Detrás del título, ocho ingenieros de Google Brain—liderados por Ashish Vaswani y Noam Shazeer—proponían una idea tan sencilla como disruptiva: para comprender y generar lenguaje basta con una red que sepa atender a las palabras relevantes, sin recurrir a los engorrosos bucles de las RNN ni a los costosos filtros de las CNN.
El truco estaba en el mecanismo de “auto-atención”, capaz de mirar una frase completa de un golpe y calcular qué términos importan más para predecir el siguiente. Resultado: un modelo que entrenaba más rápido, paralelizaba mejor en las GPU y, para sorpresa de todos, superaba con holgura al estado del arte en traducción automática. Así nació el Transformer.
Lo que parecía un avance “solo” en traducción se convirtió en la piedra angular de la IA moderna. BERT, GPT, Claude, Gemini… todos comparten el mismo esqueleto transformer que debutó aquel 12 de junio. De hecho, cada vez que un chatbot completa tu frase, una IA colorea una ilustración o un buscador te ofrece un resumen inteligente, está funcionando la herencia de ese paper de 2017.
Está claro: en IA, una buena idea puede pasar de preprint a motor de la economía digital en tiempo récord. Así que, igual que el transformer se llevó todo el protagonismo al poner atención en lo esencial, pongamos nosotros la atención en las ideas frescas que protagonizarán la próxima revolución. ¡Arrancamos!
Esta semana en WIAI…
📚⚡ Gemini 2.5 Pro supera a OpenAI en comprensión de textos largos
🔌📂 ChatGPT se conecta con tus archivos y graba tus reuniones
⏰📲 Gemini se organiza por ti: acciones programadas con IA
🛑💻 Anthropic corta acceso a Windsurf y apuesta por agentes de código propios
🔍💬 Google empieza a probar con usuarios “Search Live”: búsqueda conversacional en tiempo real
🚄💻 Mistral Code: el asistente IA europeo que pisa fuerte en el desarrollo
📚 Junto con otras noticias interesantes sobre IA
No te pierdas nada
📚⚡ Gemini 2.5 Pro supera a OpenAI en comprensión de textos largos
Google Gemini 2.5 Pro lidera el benchmark Fiction.Live, destacándose por su precisión al procesar textos extensos y complejos. Supera a OpenAI o3 cuando el contexto se amplía más allá de las 128.000 tokens.
Gemini 2.5 Pro mantiene >90% de precisión hasta 192.000 tokens, mientras que OpenAI o3 colapsa más allá de 128.000. Esto equivale a procesar documentos de más de 140.000 palabras sin perder coherencia ni contexto narrativo.
A pesar de que modelos como Llama 4 Maverick (Meta) ofrecen ventanas de hasta 10 millones de tokens, la calidad se degrada si el modelo no filtra bien la información. DeepMind advierte: “más no siempre es mejor”.
Nikolay Savinov (Google DeepMind) sugiere eliminar contenido irrelevante antes de procesar textos largos. Aunque los modelos puedan manejar grandes volúmenes, la precisión depende de cómo y qué información se les da.
🔌📂 ChatGPT se conecta con tus archivos y graba tus reuniones
ChatGPT ahora puede acceder directamente a archivos en Google Drive, Box, Dropbox, SharePoint y OneDrive, respetando los permisos y jerarquías de acceso de la organización. Esto permite consultas tipo: “¿Qué dice nuestro informe financiero de Q4 sobre gastos en I+D?”, y obtener respuestas precisas combinando múltiples fuentes.
Se suma una función de grabación y transcripción de reuniones, que genera notas con citas temporales y sugiere action items. Todo esto se puede consultar vía chat, igual que un documento, y los puntos clave se pueden convertir en documentos Canvas listos para trabajar o compartir.
Los nuevos conectores a HubSpot, Linear y herramientas de Google/Microsoft (en beta), junto con el soporte para MCP (Model Context Protocol), permiten preparar informes avanzados combinando datos internos con información web. Esta función está disponible para usuarios Pro, Team y Enterprise.
⏰📲 Gemini se organiza por ti: acciones programadas con IA
Ahora, los usuarios pueden pedirle a Gemini que ejecute tareas en momentos específicos o de forma recurrente (diaria, semanal, tras eventos). Ejemplos: resumen diario del calendario, ideas de contenido los lunes o alertas post-evento.
Las tareas programadas se gestionan desde un nuevo panel en configuración. Se pueden pausar, eliminar o editar fácilmente, y las acciones basadas en ubicación usan el lugar en que fueron creadas.
Gemini envía recordatorios y actualizaciones adaptadas a tus preferencias, desde outfits según el clima hasta novedades sobre tus artistas favoritos. Disponible para usuarios AI Pro, AI Ultra y algunos planes Workspace.
🛑💻 Anthropic corta acceso a Windsurf y apuesta por agentes de código propios
Jared Kaplan (CSO de Anthropic) confirmó que cortaron el acceso de Windsurf a Claude 3.5 y 3.7 Sonnet ante rumores de su adquisición por parte de OpenAI. “Sería raro venderle Claude a OpenAI”, dijo. La medida obliga a Windsurf a buscar nuevos proveedores de cómputo.
Anthropic enfrenta restricciones de capacidad computacional y prioriza relaciones “sostenibles”. Está aumentando su infraestructura gracias a un nuevo clúster de cómputo con Amazon, que ampliará disponibilidad en los próximos meses.
Kaplan reafirmó el foco de Anthropic en agentes programáticos como Claude Code, dejando atrás el paradigma estático de los chatbots. Empresas como Cursor —con quien ya colaboran— son sus nuevos aliados clave para impulsar herramientas de desarrollo asistido por IA.
🔍💬 Google empieza a probar con usuarios “Search Live”: búsqueda conversacional en tiempo real
Google empieza a probar Search Live, una nueva experiencia de conversación en vivo integrada en AI Mode, impulsada por Project Astra. Permite dialogar en tiempo real con la Búsqueda de Google, combinando voz, contexto visual (pronto) y respuestas precisas con fuentes citadas.
Search Live sustituye el botón de Google Lens por un ícono con forma de onda brillante, permitiendo hacer preguntas por voz, recibir respuestas con fuentes citadas y continuar el diálogo sin interrupciones — incluso en segundo plano.
Presenta una pantalla completa con fondo claro u oscuro, botón para silenciar y un acceso directo al historial. Puedes elegir entre 4 voces (Cosmo, Neso, Terra, Cassini), pero de momento no hay transcripción en tiempo realni soporte para cámara (por ahora).
Como Gemini Live, Search Live irá evolucionando desde voz hacia visión. Ya está disponible en la app de Google para iOS y Android a través de Search Labs, marcando el inicio de una Búsqueda más interactiva, asistida y multimodal.
🚄💻 Mistral Code: el asistente IA europeo que pisa fuerte en el desarrollo
Mistral lanza Mistral Code, su cliente de codificación inteligente para competir con GitHub Copilot y Cursor. Es un entorno completo con modelos propios, despliegue local o en la nube, y herramientas para equipos empresariales. Está disponible en beta privada para JetBrains y VS Code.
Mistral Code integra modelos como Codestral (autocompletado), Codestral Embed (búsqueda), Devstral (agente inteligente) y Mistral Medium (asistente conversacional). Soporta +80 lenguajes y plugins, razona sobre archivos, terminales e incidencias.
Se puede post-entrenar con código privado, crear variantes ligeras y gestionar todo desde un panel de administración con métricas, control de uso, asientos y políticas de despliegue. Funciona incluso en entornos air-gapped.
Ya es usado por SNCF, Abanca y Capgemini. Mistral planea contribuir mejoras al proyecto open source Continue, del que parte Mistral Code. Esto refuerza su estrategia de combinar innovación propietaria con comunidad abierta.
Si tienes ganas de mas…
Amazon ‘testing humanoid robots to deliver packages’
AI Chatbot Turns Out to Be 700 Engineers in India
Apple's ChatGPT Rival Moves Forward, But Siri's Future Still Uncertain
DeepSeek may have used Google’s Gemini to train its latest model
🎁 Bonus track
Esta semana, en el podcast de Lex Fridman, Sundar Pichai se pasó a tomar un café virtual y, de paso, a soltar varias “perlas” sobre impacto y el futuro de la IA.
“La IA será aún más grande que la electricidad”, dijo, como quien comenta la bolsa.
Según Pichai, habrá avances “de locos” antes de 2030, aunque la inteligencia realmente “general” tardará un poco más en llegar.
Como no, también habló de “Gemini Everywhere”, Veo3 y todo lo que esta por llegar en Google.
Más que recomendado!
Y si te ha gustado la publicación, ¡no olvides compartirla!
Y si aún no estas suscrito, ¿a qué esperas? 😉
Déjanos tu opinión: