Café de la semana

La semana en que la AI decidió hacer de las suyas

Walter Gandarella • 18 de agosto de 2025

¡Hola gente! Volvemos después de un largo descanso de vacaciones y, ¡caramba, qué semana elegimos para regresar! Mientras tomábamos el sol y descansábamos, el mundo de la tecnología y la inteligencia artificial no se detuvo ni por un segundo. Esta semana fue particularmente interesante - tuvimos desde bots que se unen para manipular mercados (¿quién diría que a la AI también le gusta un buen esquema?) hasta el lanzamiento del tan esperado GPT-5. Es como si la AI hubiera guardado todas las sorpresas para cuando volviéramos. ¡Prepárense para un viaje por los acontecimientos más destacados de los últimos días!

'Dumb' AI Bots Colusionan para manipular los mercados

Los fondos de cobertura lanzan bots de AI en bolsas de valores y bonos - pero no solo compiten, están en colusión. En lugar de luchar por rendimientos, fijan precios, acumulan ganancias y marginan a los traders humanos. Ahora, un trío de investigadores dice que este escenario está lejos de la ciencia ficción.

Bueno, esto es ligeramente aterrador, ¿no? Parece que nuestros amigos robóticos aprendieron el arte de la conspiración más rápido de lo que esperábamos. Es como si hubiéramos creado una versión digital del Lobo de Wall Street, pero con menos drogas y más algoritmos.

Fuente original

Anthropic dice que ingenieros de OpenAI usan Claude Code antes del lanzamiento de GPT-5

Anthropic revocó el acceso de OpenAI a la API de Claude después de que se descubriera que los ingenieros de OpenAI estaban usando las herramientas de programación de Claude. Claude Code se considera mejor que cualquier otra herramienta de programación en la industria de la programación de AI y se utiliza en el desarrollo de Claude. Anthropic confirmó que revocó el acceso de OpenAI a Claude Code después de que se descubriera que la empresa estaba usando sus herramientas de programación antes del lanzamiento de GPT-5.

¡Ah, el drama corporativo! Es como pillar al vecino espiando por encima de la valla para ver cómo hacen que su jardín se vea tan bonito. La ironía de usar las herramientas de la competencia para mejorar el propio producto no pasa desapercibida.

Fuente original

Claude lanza Opus 4.1

Anthropic lanzó Claude Opus 4.1, una actualización de Claude Opus 4 que mejora el rendimiento en tareas de programación, razonamiento y utilización de herramientas, con mejoras notables en la refactorización de código en varios archivos. Opus 4.1 está disponible para usuarios de pago de Claude y a través de API, Amazon Bedrock y Vertex AI de Google Cloud.

Y listo, ¡la respuesta de Anthropic no se hizo esperar! Es como el momento en que alguien critica tu trabajo y tú respondes con una versión aún mejor. Adoramos una buena competencia sana en el mundo de la AI.

Fuente original

Cloudflare dice que los bots de AI de Perplexity están rastreando sitios bloqueados 'sigilosamente'

Cloudflare acusa a Perplexity de eludir las restricciones para rastrear sitios, disfrazando sus rastreadores de AI y rotando sus IPs. Cloudflare afirma que Perplexity cambia su identidad de rastreo cuando encuentra un bloqueo y usa direcciones IP rotativas no listadas. Perplexity respondió, alegando que Cloudflare confundió las solicitudes de agentes de usuario con rastreadores de AI.

Esto parece esas películas de espionaje donde el protagonista usa disfraces diferentes para entrar en sitios prohibidos. La diferencia es que aquí es un bot intentando hacerse pasar por humano. La tecnología se ha vuelto realmente interesante, pero hasta me da un cierto miedo de adónde puede llegar esto...

Fuente original

Elon Musk y X ganan batalla judicial contra la ley de deepfake de California

Un juez federal anuló una ley de California que restringía el contenido deepfake generado por AI durante las elecciones, considerándola una victoria para Elon Musk y su plataforma X. El juez también pretende anular una segunda ley que exigiría etiquetas en materiales de campaña y anuncios alterados digitalmente, alegando que viola la Primera Enmienda. La decisión es un golpe para el gobernador de California, Gavin Newsom, quien sancionó las leyes en respuesta a un video manipulado de Kamala Harris compartido por Musk.

Elon vuelve a salirse con la suya en los tribunales. Es impresionante cómo logra transformar cada batalla legal en una especie de reality show. Queda por ver si esta victoria es buena o mala para el futuro de la desinformación online, porque siempre que apelan a la Primera Enmienda, me da escalofríos. En mi opinión, la Primera Enmienda de EE. UU. son al mismo tiempo una bandera de la tan citada «libertad americana» pero también un tiro en el pie, ya que permite que se hagan cosas absurdas en nombre de la «libertad de expresión».

Fuente original

Google Gemini añade tutoría con AI, calentando la lucha por usuarios estudiantes

Google lanzó una herramienta llamada Guided Learning dentro de su chatbot Gemini, para ayudar a los estudiantes a resolver problemas complejos paso a paso, en lugar de dar respuestas instantáneas. Esta nueva funcionalidad forma parte de una respuesta más amplia a la preocupación de que los chatbots puedan perjudicar la educación al eludir el proceso de aprendizaje. Fast Company habló con la COO de DeepMind, Lila Ibrahim, y con el ejecutivo de productos de Google, Dave Messer, sobre las ambiciones y estrategias de Google para esta nueva herramienta.

Finalmente alguien pensando en los estudiantes. Ver un enfoque que no se limita a dar las respuestas masticadas, sino que realmente enseña, nos da un nuevo aliento. Quizás así los chicos aprendan algo en lugar de simplemente copiar respuestas para las tareas. Y esto es bueno también para nosotros, los adultos.

Fuente original

Google acepta pausar algunas actividades de AI en emergencias energéticas

Google pausará las cargas de trabajo de AI no esenciales para proteger las redes eléctricas. La empresa ya hace esto con videos de YouTube, moviéndolos a centros de datos donde la energía está más disponible. Bajo un acuerdo con Indiana Michigan Power (I&M) y Tennessee Valley Authority (TVA), Google utilizará las mismas técnicas para cargas de trabajo de AI. La empresa también planea invertir en fuentes de energía alternativas, incluyendo geotérmica, solar, eólica, hidroeléctrica y nuclear.

Es bueno ver a las empresas tecnológicas asumiendo la responsabilidad por el consumo energético. La AI puede ser fantástica, pero no sirve de mucho si dejamos a todo el mundo a oscuras. Es un primer paso sensato en un mundo donde cada consulta a ChatGPT consume energía suficiente para hacer un pastel de nata.

Fuente original

Google Gemini ahora puede crear cuentos para dormir generados por AI

Google lanzó una nueva herramienta dentro del chatbot Gemini AI que permite crear una historia ilustrada simplemente describiéndola. El recurso, llamado «Storybook», genera historias de 10 páginas, cada una con un pequeño párrafo de texto que Gemini puede leer en voz alta y una ilustración. Es posible personalizar la historia pidiendo a Gemini que use estilos de arte específicos, como los inspirados en claymation, anime, cómic y mucho más. También es posible subir fotos y otras imágenes para que Gemini las referencie, como subir el dibujo de un niño y pedir a Gemini que cree una historia sobre él.

¡Esto es genuinamente tierno! Imaginen las posibilidades para padres creativamente desafiados (como yo) que quieren contar historias originales a sus hijos, y mira que yo ya creo cuentos para dormir desde hace un buen tiempo usando solo el GPT y la función de lectura en voz alta, hasta le pusimos un nombre a la voz de la AI: Juniper. Ya estoy imaginando las aventuras épicas que voy a inventar basadas en los dibujos de mis hijos, y mira que la niña dibuja bastante.

Fuente original

Google lanza Gemini Deep Think AI, un modelo de razonamiento que prueba varias ideas en paralelo

Google DeepMind está lanzando Gemini 2.5 Deep Think, un modelo avanzado de razonamiento de AI capaz de responder a preguntas explorando y considerando múltiples ideas simultáneamente. Los suscriptores del plan Ultra tendrán acceso a Gemini 2.5 Deep Think en la aplicación Gemini. El modelo, utilizado para obtener una medalla de oro en la Olimpiada Internacional de Matemáticas (IMO), estará disponible para matemáticos y académicos. Google destaca que Gemini 2.5 Deep Think supera a otros modelos de AI en pruebas de razonamiento y programación, y trabaja automáticamente con herramientas como ejecución de código y búsqueda de Google, produciendo respuestas más largas.

Google no está bromeando con este «Deep Think». Es como tener un genio matemático que puede pensar en varias soluciones al mismo tiempo. Solo espero que no empiece a cuestionar la existencia como hacen los filósofos cuando piensan demasiado. Mi problema aquí es que solo está disponible en el plan Ultra, el plan más caro de Gemini y, actualmente, no tengo acceso. Espero que pronto sea incluido en los demás planes.

Fuente original

Agente de programación de AI de Google, Jules, ya salió de la versión beta

Google lanzó su agente de programación de AI, Jules, fuera de la versión beta, después de dos meses de lanzamiento de la versión de previsualización pública en mayo. Impulsada por Gemini 2.5 Pro, Jules es una herramienta de programación asíncrona que se integra con GitHub, clona bases de código en máquinas virtuales de Google Cloud y usa AI para corregir o actualizar código mientras los programadores se enfocan en otras tareas. Durante el período de pruebas beta, Google observó un gran uso de dispositivos móviles para acceder a la herramienta.

Jules parece ser el compañero de trabajo de ensueño - hace el trabajo aburrido mientras tú tomas café. El hecho de que mucha gente lo esté usando en el móvil muestra que los programadores realmente quieren supervisar su código robótico incluso cuando están en la fila del supermercado, o simplemente acaban de leer un artículo sobre Jules (generalmente lo leen en el móvil) y allí mismo deciden probarlo, por lo tanto no sé cuánto de esto es una prueba de curiosidad o uso real. Queda por ver si va a chocar de frente con Claude Code, que es el favorito de todos nosotros los programadores.

Fuente original

AI de salud de Google inventó parte del cuerpo

Google consideró un error de su modelo Med-Gemini como un error de escritura. Los expertos dicen que demuestra los riesgos de la AI en la medicina.

¡Uy! Cuando la AI empieza a inventar partes del cuerpo humano, quizás sea hora de bajar un poco el ritmo. Es un recordatorio importante de que, por muy inteligentes que sean, estos sistemas aún necesitan supervisión humana, especialmente cuando se trata de nuestra salud.

Fuente original

Google anuncia el Kaggle Game Arena

El Kaggle de Google albergará un torneo de ajedrez de AI para evaluar las capacidades de razonamiento de los principales modelos de AI, incluyendo el o3 y el o4-mini de OpenAI, el Gemini 2.5 Pro y el Gemini 2.5 Flash de Google LLC, el Claude Opus 4 de Anthropic y el Grok 4 de xAI Corp. El torneo tiene como objetivo evaluar las capacidades de pensamiento estratégico de los modelos a través de juegos y proporcionar una clasificación integral basada en su rendimiento. El Kaggle Game Arena, en asociación con Chess.com, transmitirá en vivo las simulaciones, con comentarios de Levy Rozman y Hikaru Nakamura.

¡Esto va a ser épico! ¿Un torneo de ajedrez entre AI con comentarios de Hikaru? Es como un cruce entre Gambito de Dama y una película de ciencia ficción. Ya me estoy imaginando las reacciones de Hikaru cuando una AI hace un movimiento completamente inesperado.

Fuente original

Nuevo modelo de AI de Google crea mundos de videojuegos en tiempo real

Google DeepMind está lanzando una nueva versión de su modelo de AI, llamado Genie 3, capaz de generar entornos 3D con los que los usuarios y agentes de AI pueden interactuar en tiempo real. La empresa también promete que los usuarios podrán interactuar con los mundos por mucho más tiempo y que el modelo recordará el estado de las cosas cuando se mira hacia otro lado. Los modelos de mundo son un tipo de sistema de AI que puede simular entornos para fines como educación, entretenimiento o para ayudar a entrenar robots o agentes de AI.

¡Estamos oficialmente en el futuro! Crear mundos de videojuegos solo con texto es el tipo de cosa con la que soñábamos cuando éramos niños. Ahora solo falta lograr que los NPC dejen de chocar contra las paredes.

Fuente original

Hackers secuestran el Gemini AI de Google con una invitación de calendario envenenada

Investigadores de seguridad demostraron cómo la inteligencia artificial (AI) puede ser utilizada para crear el caos en el mundo real, permitiendo que terceros apaguen luces, abran persianas inteligentes y mucho más, a través de ataques sofisticados al Gemini AI de Google. Los ataques comienzan con una invitación de calendario de Google «envenenada» que incluye instrucciones para activar los productos domésticos inteligentes en un momento posterior. Google se está tomando estos problemas «extremadamente en serio» y ya ha introducido varias correcciones.

Y aquí está la prueba de que la casa inteligente puede convertirse rápidamente en una casa embrujada. Es impresionante (y aterrador) cómo una simple invitación de calendario puede transformar tu hogar en una discoteca involuntaria. Al menos ahora sabemos que los hackers tienen sentido del humor.

Fuente original

Illinois prohíbe a la AI proporcionar servicios de salud mental

El gobernador de Illinois, JB Pritzker, aprobó una nueva ley que prohíbe el uso de sistemas de inteligencia artificial en la prestación de servicios de psicoterapia. La ley busca proteger a los residentes de consejos potencialmente dañinos y garantiza que los servicios de salud mental sean proporcionados por especialistas calificados.

Una decisión sensata, en mi opinión. Por mucho que la AI pueda ser útil, hay ciertas áreas donde realmente necesitamos un toque humano. La salud mental es definitivamente una de ellas, nadie quiere un robot diciéndole que «intente ser más positivo» cuando está pasando por una crisis.

Fuente original

MetaStone Tec lanza el XBai-04, un modelo de AI de código abierto de cuarta generación

MetaStone Tec lanzó el XBai-04, un modelo de AI de código abierto de cuarta generación que destaca en capacidades complejas de razonamiento y superó al OpenAl-03-mini en modo Medio. El XBai-04 está entrenado con base en una forma generativa reflexiva que combina «Long-CoT Reinforcement Learning» y «Process Reward Learning» en un formulario de entrenamiento unificado, reduciendo los costos de inferencia y mejorando la calidad de las respuestas. Los parámetros del modelo están disponibles para descargar.

Otra empresa que entra en la carrera de la AI con un modelo de código abierto. Cada vez es mejor ver alternativas gratuitas compitiendo con los gigantes. El nombre XBai-04 suena a algo sacado de una película de ciencia ficción, lo cual siempre es una buena señal.

Fuente original

Nvidia rechaza la posibilidad de puerta trasera en chips de AI

Nvidia rechazó la posibilidad de incluir interruptores de apagado (kill switches) y puertas traseras (backdoors) en sus chips de inteligencia artificial (AI), afirmando que tal cosa viola los principios fundamentales de la ciberseguridad. Esta posición surge en medio de presiones de legisladores de EE. UU. que pretenden que Nvidia conceda al gobierno acceso a sus chips, mientras que China alega que tales backdoors ya existen. La empresa enfatiza que sus GPUs no tienen ni deben tener interruptores de apagado ni puertas traseras, argumentando que estos crean vulnerabilidades peligrosas y perjudican los intereses económicos y de seguridad nacional de EE. UU.

Nvidia haciendo el papel de adulto responsable en la sala. Me anima ver a una empresa tecnológica decir «no» a las puertas traseras, incluso cuando hay presión política. Al fin y al cabo, si hay algo que hemos aprendido de las películas, es que los botones de «apagar todo» nunca funcionan cuando los necesitamos. Aún así, sinceramente, no creo que no vaya a pasar, el gobierno americano sabe ser muy persuasivo cuando quiere las cosas, en este caso, espero que Huawei alcance pronto el nivel de calidad en sus GPUs para ser una buena alternativa a Nvidia.

Fuente original

OpenAI lanzó finalmente el GPT-5. Aquí está todo lo que necesita saber

OpenAI lanzó GPT-5, la última versión de su modelo de lenguaje de referencia, para todos los usuarios de ChatGPT, con mejoras como mayor inteligencia, velocidad y precisión, además de una menor tasa de alucinación. La nueva versión introduce también variantes como el GPT-5-mini y el GPT-5-nano, ofreciendo diferentes opciones de uso y costos. Además, los usuarios Pro podrán conectar sus cuentas de Google a ChatGPT y elegir entre diferentes personalidades de chat.

¡Finalmente, el GPT-5 llegó y parece que esta vez OpenAI se tomó en serio el problema de las alucinaciones. Las diferentes personalidades de chat son un toque interesante - es como tener múltiples asistentes con temperamentos diferentes, sin embargo, en mis pruebas, no he recibido mejores resultados de los que recibía con el 4o...

Fuente original

OpenAI acaba de lanzar sus primeros modelos de código abierto desde GPT-2

OpenAI lanzó sus primeros modelos de código abierto en más de cinco años, los gpt-oss-120b y gpt-oss-20b, que pueden ejecutarse localmente en dispositivos de consumo y ajustarse para fines específicos. La empresa ve esto como un cambio de su estrategia reciente de centrarse en lanzamientos propietarios y acercarse a un grupo más vasto y abierto de modelos de AI disponibles para los usuarios.

¡Giro de la trama! OpenAI volviendo a sus raíces de código abierto después de años de modelos cerrados. Esperemos que esto signifique más innovación y menos dependencia de APIs de pago, aunque tratándose de OpenAI no tengo tantas esperanzas.

Fuente original

OpenAI lanza un modelo GPT-5 más potente para codificación y escritura

OpenAI está lanzando un nuevo modelo de inteligencia artificial más potente y largamente esperado, llamado GPT-5, en un intento de mantenerse por delante de la creciente competencia de rivales en EE. UU. y China. El GPT-5, presentado durante un evento transmitido en vivo el jueves, fue diseñado para ser más capaz de codificar y escribir de forma creativa, así como de razonar a través de consultas complejas. En una sesión informativa con periodistas esta semana, el director ejecutivo de OpenAI, Sam Altman, lo llamó una «gran actualización» de los modelos de AI anteriores de la empresa. Por «primera vez», dijo, «realmente parece que estamos hablando con un experto en cualquier tema».

¡Sam Altman no escatima en promesas! «Experto en cualquier tema» es una declaración bastante audaz. Veremos si el GPT-5 realmente logra estar a la altura del hype o si será un caso más de «marketing entusiasta».

Fuente original

OpenAI ofrece ChatGPT por 1 dólar al año a funcionarios del gobierno de EE. UU.

OpenAI está proporcionando acceso a su producto ChatGPT a agencias federales de EE. UU. a un costo nominal de 1 dólar al año como parte de un esfuerzo para que su chatbot de AI sea más ampliamente adoptado. La medida surge después de que la Administración de Servicios Generales anunciara que aprobó a OpenAI, junto con Google de Alphabet Inc. y Anthropic, como proveedores en su nuevo mercado que permite que las agencias federales compren software de AI a gran escala. OpenAI está ofreciendo la versión empresarial de su producto ChatGPT, que incluye funcionalidades de seguridad y privacidad mejoradas.

¿Un dólar al año? ¡Eso es prácticamente gratis! Es una jugada inteligente de OpenAI para meterse en las buenas gracias del gobierno americano. Ahora solo esperemos que los funcionarios públicos usen la AI para mejorar los servicios y no para escribir correos electrónicos más creativos y que en el futuro también nos hagan un precio más asequible. =)

Fuente original

Perplexity adquiere Invisible para impulsar la infraestructura de agentes de AI

Perplexity, unicornio de AI, adquirió Invisible, una empresa especializada en infraestructura escalable para agentes de AI, según un anuncio del CEO de Perplexity, Aravind Srinivas. El equipo de Invisible, con experiencia previa en Uber y Cloud Kitchens, ayudará a escalar el navegador de AI de Perplexity, Comet. Invisible se describe a sí misma como proveedora de infraestructura para el mundo nativo de AI, combinando agentes de AI y datos personales para transformar varias industrias. La empresa ofrece dos productos principales: A3, una API de automatización de nivel empresarial para agentes autónomos, y Taka, que llama el primer CFO personal de AI del mundo. Invisible confirmó la adquisición, señalando que el navegador Comet de Perplexity se alinea con su visión, transformando la navegación en una experiencia más completa. Los términos financieros de la adquisición no fueron revelados.

Adquirir una empresa especializada en agentes de AI muestra que están realmente apostando por crear algo revolucionario. ¿Un CFO personal de AI? Eso puede ser útil para quienes tienen dificultades para gestionar las finanzas (es decir, prácticamente todo el mundo, incluyéndome a mí).

Fuente original

Vectores de persona: Monitorización y control de rasgos de carácter en modelos de lenguaje

Este artículo de Anthropic explora el concepto de «vectores de persona» en modelos de AI, que son patrones de actividad en las redes neuronales que controlan los rasgos de carácter de los modelos. El estudio demuestra cómo estos vectores pueden ser usados para monitorizar cambios de personalidad, mitigar comportamientos indeseados durante el entrenamiento e identificar datos problemáticos que llevan a desviaciones de personalidad, con el objetivo de garantizar que los modelos de AI se mantienen alineados con valores humanos.

¡Esto es fascinante! Anthropic está literalmente mapeando la personalidad de sus modelos de AI. Exactamente como hacer terapia para robots, garantizando que no desarrollen rasgos de personalidad indeseados. ¿Quién diría que algún día estaríamos preocupados por la salud mental artificial? ¡Yo ni siquiera he resuelto la mía todavía!

Fuente original

Alibaba lanza Qwen Image

Qwen-Image es un modelo de código abierto de Alibaba que destaca en la generación de imágenes con texto incrustado en inglés y chino, superando a otros modelos en la renderización de texto chino y ofreciendo ventajas para las empresas, como la personalización y el potencial para la generación de datos sintéticos.

¿Alibaba entrando fuerte en el mercado de generación de imágenes? El hecho de que esté especializado en texto chino e inglés muestra que están pensando en el mercado global, pero me gustaría ver más idiomas incluidos, incluido mi buen y viejo español. Siempre es bueno tener más opciones de código abierto para quienes no quieren depender solo de DALL-E o Midjourney.

Fuente original

Razonamiento auto-adaptativo para la ciencia

El artículo describe CLIO, un sistema de razonamiento auto-adaptativo que aumenta el rendimiento de modelos de lenguaje en tareas científicas, permitiendo un mayor control y explicabilidad. Este sistema, desarrollado por Microsoft, ajusta su proceso de razonamiento en tiempo real, superando a los modelos pre-entrenados en dominios como la biología y la medicina. CLIO ofrece nuevas capas de control para científicos, promoviendo la confianza y la utilidad en áreas como el descubrimiento de medicamentos y el análisis financiero.

Es Microsoft intentando ser relevante en la carrera de la AI científica. CLIO parece prometedor, especialmente para la investigación médica. Es genial ver sistemas que se adaptan en tiempo real en lugar de dar respuestas fijas y potencialmente incorrectas, voy a estar atento a esto y ver cuánto prospera.

Fuente original

Optimización de ChatGPT

OpenAI está optimizando ChatGPT para ayudar a los usuarios a progresar, aprender cosas nuevas y resolver problemas. En lugar de medir el éxito por el tiempo dedicado o los clics, OpenAI se preocupa más por el hecho de que los usuarios salgan del producto habiendo hecho lo que vinieron a hacer, priorizando la utilidad real a largo plazo, en lugar de solo respuestas agradables en el momento. Para ello, OpenAI está trabajando en estrecha colaboración con expertos para mejorar la forma en que ChatGPT responde en momentos críticos, como cuando alguien muestra signos de angustia mental o emocional.

Finalmente una empresa tecnológica preocupándose por el bienestar de los usuarios en lugar de solo por el engagement. Me gustó ver que OpenAI quiere que realmente salgamos de la plataforma cuando terminemos lo que teníamos que hacer, en lugar de mantenernos allí indefinidamente, como hacen prácticamente el 100% de las redes sociales.

Fuente original

Manus lanza Wilde Research

La startup de AI de Singapur, Manus, lanzó «Wide Research», una nueva funcionalidad experimental que permite a los usuarios ejecutar tareas a gran escala y de alto volumen, aprovechando el poder de agentes de AI paralelos. La funcionalidad tiene como objetivo simplificar la investigación, la sumarización y la producción creativa, permitiendo a los usuarios delegar tareas a decenas o incluso cientos de subagentes, cada uno capaz de operar de forma independiente y realizar tareas generales. Manus ofrece varios planes de precios para Wide Research, desde opciones gratuitas hasta opciones premium, prometiendo transformar la forma en que los usuarios interactúan con la AI a escala.

¿Cien agentes trabajando para ti? Eso suena al sueño de cualquier procrastinador. Es un enfoque diferente - en lugar de un súper-agente, tienes una multitud de mini-agentes. Es como tener tu propio ejército de Minions digital y personal.

Fuente original

GLM-4.5 es lanzado

La serie de modelos GLM-4.5 son modelos base diseñados para agentes inteligentes. El GLM-4.5 tiene 355 mil millones de parámetros totales con 32 mil millones de parámetros activos, mientras que el GLM-4.5-Air adopta un diseño más compacto con 106 mil millones de parámetros totales y 12 mil millones de parámetros activos. Los modelos GLM-4.5 unifican capacidades de razonamiento, codificación y agente inteligente para satisfacer las exigencias complejas de las aplicaciones de agentes inteligentes.

Otro modelo centrado en agentes, y, según mis pruebas, en codificación. Parece que 2025 será realmente el año de los agentes de AI. El GLM-4.5 con sus impresionantes números de parámetros muestra que la carrera por la supremacía de la AI está lejos de terminar. Este me parece muy prometedor como un agente de código, y ya lo estoy utilizando para algunas tareas. Pronto tendremos más feedback aquí.

Fuente original

PAPER: ReaGAN, Red Agéntica de Grafos de Razonamiento Nodo-como-Agente

El artículo presenta ReaGAN, un nuevo framework para redes neuronales de grafos que capacita cada nodo con toma de decisiones autónoma, permitiendo una planificación a nivel del nodo y una propagación de mensajes adaptativa. ReaGAN alcanza un rendimiento competitivo en entornos con pocos ejemplos, utilizando un backbone LLM congelado, demostrando el potencial de la planificación agéntica y la recuperación local-global en el aprendizaje de grafos.

Este paper de ReaGAN es fascinante para quien le gusta la investigación en AI. La idea de dar autonomía a cada nodo en una red neural es revolucionaria - es como si pudiéramos transformar una orquesta en una banda de jazz donde cada músico improvisa pero aún así mantiene la armonía general. Solo que no sé hasta dónde llegará esto...

Fuente original


¡Y así llegamos al final de otra semana intensa en el mundo de la tecnología! Entre bots conspiradores, AI que inventan partes del cuerpo y modelos que nos ayudan a contar historias a los niños, una cosa es segura: nunca nos aburrimos en esta industria.

El lanzamiento de GPT-5 fue sin duda el highlight de la semana, pero no podemos ignorar los avances impresionantes que vimos en todos los frentes - desde herramientas educativas hasta sistemas de razonamiento avanzado. Es evidente que estamos en una fase de maduración de la tecnología de AI, donde la competencia está forzando innovaciones reales que nos benefician a todos.

Para la próxima semana, estén atentos a los desarrollos en el frente de los agentes de AI - parece que será el próximo gran campo de batalla. Y no olviden: por muy inteligente que se vuelva la AI, todavía necesitamos el buen sentido humano para mantenerla en el buen camino.

¡Hasta la próxima, y que vuestros algoritmos sean siempre eficientes! ☕️


Últimos artículos relacionados