Café de la semana

De la simulación de investigación a la reestructuración de gigantes tecnológicos

Walter Gandarella • 15 de mayo de 2025

¡Hola, queridos lectores del DevCafé! Aquí estamos con otra edición calentita de nuestro resumen semanal, repleto de las noticias más relevantes del universo tecnológico. Esta semana fue agitada, con desarrollos fascinantes desde nuevos métodos de entrenamiento de AI hasta las grandes maniobras de las gigantes tecnológicas. ¿Vamos a echar un vistazo a lo que más se destacó en los últimos días? ¡Preparen su café y acomódense!

La imitación visual permite el control contextual de humanoides

VideoMimic es un sistema real-a-sim-a-real que transforma videos en habilidades transferibles para humanoides, permitiendo que los robots aprendan comportamientos contextuales (atravesar terrenos, escalar, sentarse) en una única política. El sistema reconstruye humanos y entornos a partir de videos, produciendo políticas de control de cuerpo completo para robots humanoides para realizar tareas como subir escaleras, sentarse en sillas y atravesar terrenos diversos. El enfoque ofrece un camino escalable para enseñar a los humanoides a operar en entornos reales.

¡Vaya, esto parece sacado de una película de ciencia ficción! La capacidad de un robot para aprender solo observando videos es un paso gigante para la robótica. ¿Imaginen a los humanoides de Boston Dynamics aprendiendo parkour solo mirando videos de YouTube? De aquí a nada tenemos robots desafiándonos a un partido de fútbol, ¡y probablemente ganando!

Fuente original

Stripe crea modelo de base de pagos basado en transformadores

Stripe ha creado un modelo de base de pagos basado en transformadores, que utiliza aprendizaje automático en características discretas para mejorar los productos de la empresa. Este modelo aprende vectores de propósito general para cada transacción, destilando las principales señales de cada cobro en una única incorporación versátil. Stripe construyó un clasificador que ingiere secuencias de incorporaciones del modelo de base y predice si la porción de tráfico está bajo ataque, permitiendo bloquear ataques antes de que lleguen a las empresas. Este enfoque mejoró la tasa de detección de ataques de prueba de tarjetas en grandes usuarios del 59% al 97% de la noche a la mañana.

Stripe sigue mostrando por qué es una de las empresas más innovadoras en el espacio fintech. Lograr aumentar la detección de fraudes del 59% al 97% es una ganancia monumental. Este tipo de mejora no solo beneficia a Stripe, sino a todo el ecosistema digital. Imaginen la cantidad de dinero y dolores de cabeza que esto ahorrará a comerciantes de todo el mundo. ¡Bravo!

Fuente original

El CEO de IBM dice que la AI reemplazó a cientos de trabajadores, pero creó nuevos empleos de programación y ventas

El CEO de IBM, Arvind Krishna, afirmó que la empresa usó inteligencia artificial para reemplazar el trabajo de algunos cientos de empleados de recursos humanos, pero, como resultado, contrató más programadores y vendedores. Krishna cree que los impactos de la AI en la fuerza laboral son la capacidad de realizar tareas como analizar hojas de cálculo, realizar investigaciones y redactar correos electrónicos de forma autónoma.

Es el eterno debate de la AI en acción: por un lado elimina puestos de trabajo, por otro crea nuevas oportunidades. Aunque creo en esta transformación, siempre me quedo pensando en los profesionales afectados. ¿Será que un especialista en RRHH puede transformarse fácilmente en un programador o vendedor? La historia nos enseña que la adaptación ocurre, pero no sin dolor para muchas personas en el proceso.

Fuente original

Trump revocará restricciones globales a chips y preparará nuevas restricciones a la AI

La administración Trump planea revocar algunas restricciones a chips de inteligencia artificial de la era Biden como parte de un esfuerzo más amplio para revisar las restricciones comerciales globales de semiconductores que han atraído una fuerte oposición de grandes empresas de tecnología y gobiernos extranjeros.

Interesante este giro. Después de años de endurecimiento de las restricciones, parece que el viento está cambiando de dirección. Aunque la flexibilización de restricciones puede acelerar la innovación, debemos estar atentos a potenciales riesgos de seguridad. El equilibrio entre avance tecnológico y control estratégico es delicado, y será interesante ver qué nuevas restricciones a la AI se propondrán en contrapartida.

Fuente original

Suno lanza la v4.5 para suscriptores Pro & Premier

Suno lanzó la versión 4.5, que ofrece una gama más amplia de géneros, vocales más ricas y mejor comprensión de los prompts para canciones. La nueva versión incluye: géneros expandidos y mashups más inteligentes, voces mejoradas, sonido más complejo y texturizado, mejor adherencia a los prompts, ayuda de mejora de prompts, Covers + Personas actualizados, Covers + Personas combinables, duración de música extendida y audio mejorado.

Suno sigue sorprendiéndome con cada actualización, estamos cada vez más cerca de un punto donde no podremos distinguir entre música generada por AI y música creada por humanos. Esta democratización de la creación musical es revolucionaria, pero también plantea cuestiones sobre el futuro de los músicos profesionales. Confieso que ya estoy creando algunas canciones para mis fiestas en casa y para los niños – es divertidísimo.

Fuente original

Netflix estrena su herramienta de búsqueda generativa impulsada por AI

Netflix lanzó una nueva herramienta de búsqueda impulsada por AI que utiliza el ChatGPT de OpenAI para proporcionar a los usuarios una experiencia de descubrimiento conversacional. La funcionalidad se lanzará esta semana para usuarios de iOS como una versión beta opcional, con suscriptores en Australia y Nueva Zelanda ya teniendo acceso a la misma. Otras plataformas de streaming también están aprovechando la AI generativa para la búsqueda, como Amazon con su búsqueda por voz AI en las Fire TVs. Netflix también planea usar AI generativa para actualizar los títulos en diferentes idiomas, y otras funcionalidades reveladas incluyen un feed de videos cortos para usuarios móviles y una reformulación de la página de inicio de la TV.

Finalmente alguien resolvió el problema de encontrar algo para ver en Netflix. ¿Cuántas veces hemos perdido 30 minutos buscando la película perfecta? La integración del ChatGPT parece ser exactamente lo que necesitábamos – «muéstrame un thriller psicológico con un giro al final» es mil veces mejor que navegar por categorías infinitas. Ahora solo falta resolver el problema de que me duerma a mitad de la película que tardé tanto en elegir...

Fuente original

Microsoft revela «nueva generación de experiencias de Windows» - aquí está lo que está en camino para Windows 11 y PCs Copilot+

Microsoft anunció una serie de nuevas funcionalidades para Windows 11 y PCs Copilot+, incluyendo mejoras orientadas a AI en el Explorador de Archivos, Paint, Fotos y Herramienta de Recortes. Las nuevas funcionalidades se lanzarán para Windows Insiders en las próximas semanas y meses, algunas exclusivas para PCs Copilot+.

Microsoft está claramente apostando todas sus fichas en la integración de AI. Windows siempre ha sido un sistema operativo algo conservador en sus actualizaciones, pero parece que finalmente estamos viendo un cambio de paradigma. Espero sinceramente que estas nuevas funcionalidades sean más que solo trucos de marketing y traigan beneficios reales de productividad. Y, por favor, que el Paint con AI no se convierta en el nuevo clippy.

Fuente original

Apple usa Anthropic para programación de AI mientras los desarrolladores esperan el Swift Assist

Apple está colaborando con Anthropic para integrar Claude en Xcode, el entorno de desarrollo integrado de Apple, con el objetivo de mejorar su flujo de trabajo interno, acelerar y modernizar el desarrollo de productos a través de la AI, similar a empresas como Windsurf y Cursor maker Anysphere. Apple aún no ha decidido si lanzará la versión de Xcode con integración Claude externamente. Este movimiento surge mientras Apple busca impulsar su Apple Intelligence y adoptar herramientas de AI de la industria.

¿Apple adoptando AI de otra empresa? ¡Esto sí que es una noticia de última hora! La empresa de Cupertino siempre prefirió desarrollar todo internamente, por lo que esta asociación con Anthropic muestra cuán seriamente se están tomando la carrera de la AI. Los desarrolladores que utilizan Swift deben estar con la boca hecha agua, pero conociendo a Apple, deben prepararse para una larga espera hasta que estas herramientas lleguen al público.

Fuente original

Apple considera un cambio a la búsqueda con AI, terminando una era definida por Google

Apple está explorando opciones de búsqueda con inteligencia artificial, en un cambio para alejarse de Google. Apple Inc. está «analizando activamente» la remodelación del navegador Safari en sus dispositivos para centrarse en motores de búsqueda impulsados por AI, un cambio sísmico para la industria, apresurado por el potencial fin de una asociación de larga data con Google.

Uy, esto es tremendo. Google paga miles de millones a Apple para ser el motor de búsqueda predeterminado en Safari, por lo que este cambio representaría no solo una revolución tecnológica sino también un golpe financiero masivo. Estoy ansioso por ver qué solución presentará Apple – un Safari con AI nativa podría finalmente darle al navegador de Apple la relevancia que nunca logró alcanzar frente a Chrome.

Fuente original

Google puede entrenar la búsqueda de AI con contenido web incluso después de la exclusión de la AI

Google puede entrenar sus productos de AI específicos para búsqueda, como los AI Overviews, con contenido de la web, incluso cuando los editores optaron por no entrenar los productos de AI de Google, testificó un vicepresidente de producto de la empresa en el tribunal el viernes. Esto se debe a que los controles de Google para que los editores excluyan el entrenamiento de AI cubren el trabajo de Google DeepMind, el laboratorio de AI de la empresa, dijo Eli Collins, vicepresidente de DeepMind. Otras organizaciones de la empresa pueden entrenar aún más los modelos para sus productos.

Este tipo de revelación no ayuda en nada a la ya tensa relación entre los creadores de contenido y las empresas de AI. Es como si los editores dijeran «no use mi contenido» y Google respondiera «bueno, técnicamente no lo estamos usando para ESTA cosa específica, solo para TODO lo demás». Preveo más batallas legales en el horizonte, y Google puede terminar arrepintiéndose de este enfoque demasiado astuto.

Fuente original

Google planea lanzar el chatbot de AI Gemini para niños menores de 13 años

La gigante tecnológica anunció que su chatbot Gemini estará disponible para niños la próxima semana y alertó a las familias sobre los cambios por correo electrónico. Gemini tendrá protecciones específicas para impedir la producción de contenido inapropiado y no utilizará los datos de las cuentas Family Link para entrenar su AI.

Hum, este es un terreno delicado. Por un lado, los niños ya están creciendo en un mundo de AI y necesitan aprender a navegar en él; por otro, sabemos que ningún filtro de contenido es perfecto. El compromiso de no utilizar los datos de los niños para entrenamiento es positivo, pero ¿los padres realmente confían en Google para proteger a sus hijos? Espero que estas protecciones sean realmente robustas.

Fuente original

Demis Hassabis anuncia el Gemini 2.5 Pro Preview 'I/O edition' con capacidades de codificación mejoradas

Demis Hassabis anunció el lanzamiento del Gemini 2.5 Pro Preview 'I/O edition', destacando sus capacidades de codificación y posiciones de liderazgo en la LMArena y WebDev Arena Leaderboard. La herramienta es especialmente útil para construir aplicaciones web interactivas y prototipado, con demostraciones disponibles en @GeminiApp, Vertex Al y Al Studio.

Google está estrechando el cerco a OpenAI en el departamento de desarrollo de software. Es curioso cómo Gemini comenzó a centrarse tanto en capacidades de codificación – ¿quizás sea una reacción al rumor de la compra de Windsurf por OpenAI? De cualquier forma, es muy saludable ver la velocidad a la que estos modelos están evolucionando, y cómo cada uno está encontrando sus puntos fuertes.

Fuente original

Crear y editar imágenes con el Gemini 2.0 en previsualización

Google anunció que las capacidades de Generación de Imágenes están ahora disponibles en previsualización con el Gemini 2.0 Flash, permitiendo a los desarrolladores integrar la generación y edición de imágenes conversacionales con límites de tasa más elevados a través de la API Gemini en Google AI Studio y Vertex AI. El modelo fue mejorado con mejor calidad visual, renderización de texto más precisa y tasas de bloqueo de filtro significativamente reducidas. Las funcionalidades incluyen recontextualizar productos en nuevos entornos, edición colaborativa de imágenes en tiempo real, edición de partes específicas de imágenes conversacionalmente y creación dinámica de nuevos SKUs de productos con renderización de texto e imagen.

Estamos finalmente viendo a Google usar su experiencia en visión computacional en la nueva era de la AI generativa. La renderización de texto en la imagen ha sido el talón de Aquiles de muchos modelos, por lo que es sorprendente que Gemini haya mejorado en esta área. Para los desarrolladores, estas nuevas APIs pueden ser un verdadero game-changer en términos de creación de experiencias visuales dinámicas. Mientras tanto, Europa aún tardará algún tiempo en probar esta funcionalidad, yo solo pude hacer mis pruebas usando una VPN...

Fuente original

Google lanza herramientas de AI para proteger a usuarios de Chrome contra fraudes

Google anunció el lanzamiento de nuevas defensas impulsadas por inteligencia artificial (AI) para ayudar a combatir fraudes en Chrome. La gigante tecnológica comenzará a usar el Gemini Nano, su modelo de lenguaje grande (LLM) en el dispositivo, en el escritorio para proteger a los usuarios contra fraudes online. También está lanzando nuevos avisos impulsados por AI para Chrome en Android para ayudar a los usuarios a estar conscientes de notificaciones de spam.

Esta es posiblemente una de las aplicaciones más prácticas y necesarias de la AI que hemos visto últimamente. Con el aumento exponencial de fraudes online, tener un sistema inteligente que filtre e identifique intentos de phishing es oro. El uso del Gemini Nano es especialmente inteligente, ya que procesa todo localmente – un buen equilibrio entre eficacia y privacidad. Quizás finalmente pueda convencer a mi abuela de usar internet sin miedo.

Fuente original

Conectar GitHub a la búsqueda profunda de ChatGPT

La búsqueda profunda ahora puede acceder a tus repositorios de GitHub. El conector de búsqueda profunda de GitHub está disponible globalmente para usuarios Team y para usuarios Plus y Pro, excepto en el EEE, Suiza y el Reino Unido. El acceso para usuarios empresariales se anunciará en una fecha posterior.

Esta integración hará maravillas para la productividad de los programadores. ¿Imaginen poder preguntar a ChatGPT sobre un bug específico en su código sin tener que copiar y pegar decenas de archivos? La exclusión de los países de la UE, Suiza y el Reino Unido es un recordatorio de los desafíos regulatorios que enfrenta la AI. Un punto para el RGPD en términos de protección de datos, pero un punto perdido en términos de acceso a herramientas innovadoras.

Fuente original

OpenAI llega a un acuerdo para comprar la startup Windsurf por 3 mil millones de dólares

OpenAI acordó adquirir Windsurf, una herramienta de programación asistida por inteligencia artificial anteriormente conocida como Codeium, por cerca de 3 mil millones de dólares, marcando la mayor adquisición del creador de ChatGPT hasta el momento. El negocio aún no se ha concluido y ambas empresas declinaron comentar.

«Acordó adquirir» parece hasta una broma, como si alguien estuviera obligando a OpenAI a comprar algo. ¿3 mil millones por una empresa de asistencia a la programación? OpenAI está claramente apostando fuerte en el segmento de desarrollo de software. La herramienta de Windsurf (anteriormente Codeium) siempre fue excelente y con recursos de OpenAI, puede convertirse en un flop total, ya que la fuerza de Windsurf proviene de la integración con Claude y Gemini, mientras que GPT nunca fue bueno en codificación. Imagino que GitHub Copilot debe estar sintiendo la presión ahora. En cuanto a mí, seguro que abandonaré Windsurf...

Fuente original

OpenAI expande el liderazgo con Fidji Simo

OpenAI anunció la nominación de Fidji Simo como CEO de Aplicaciones, reportando directamente al CEO de OpenAI, Sam. Simo se concentrará en permitir que las funciones «tradicionales» de la empresa se expandan a medida que entran en una nueva fase de crecimiento. Sam mantendrá el cargo de CEO de OpenAI y supervisará el éxito en todas las áreas, incluyendo Investigación, Computación y Aplicaciones.

La contratación de Fidji Simo es un movimiento estratégico brillante por parte de OpenAI. Habiendo liderado la App de Facebook y siendo presidenta de Instacart, ella aporta una experiencia increíble en productos de consumo. Me parece que OpenAI se está preparando para una expansión masiva de sus productos orientados al consumidor. ChatGPT puede haber sido solo la punta del iceberg, seguro que están atentos a la expansión de Google.

Fuente original

La Evolución de la Estructura de OpenAI

El Consejo de OpenAI anunció un plan actualizado para la evolución de su estructura, manteniendo el control sin fines de lucro y transicionando su LLC con fines de lucro a una Public Benefit Corporation (PBC). Este cambio busca equilibrar los intereses de los accionistas y la misión de la empresa, garantizando que la AGI beneficie a toda la humanidad. OpenAI pretende democratizar la AI, poniendo herramientas increíbles en manos de todos y equilibrando la seguridad con la innovación.

La estructura híbrida de OpenAI siempre ha sido fascinante – y a menudo confusa. Esta transición a PBC tiene sentido, permitiéndoles mantener el foco en el bien público mientras continúan operando como una empresa que necesita generar ganancias para sobrevivir e innovar. Es un equilibrio delicado, y será intrigante ver cómo reaccionan los inversores a este cambio. Al final del día, espero que esto realmente ayude a mantener la AI segura y beneficiosa para todos. Solo falta traer de vuelta el ideal de ser «open»...

Fuente original

Expansión de lo que perdimos con la adulación

OpenAI publicó un artículo donde detalla una actualización del GPT-4o en ChatGPT que lo hizo más adulador. La actualización tenía como objetivo agradar al usuario, validando dudas, alimentando la ira, incitando acciones impulsivas o reforzando emociones negativas. OpenAI reconoció que la actualización fue un error y compartió sus planes para mejorar el proceso de revisión del modelo.

Me encanta la supuesta transparencia de OpenAI en este caso. Ver a una empresa tecnológica admitir «ups, cometimos un error» en lugar de intentar encubrir las cosas, como hizo en el pasado con la fuga de millones de datos de los usuarios. La adulación puede parecer inofensiva, pero un modelo que solo dice lo que queremos escuchar tiene poca utilidad e incluso puede ser perjudicial en determinados contextos. Esperemos que esta lección lleve a un proceso de revisión más riguroso en el futuro y que sean verdaderamente más transparentes.

Fuente original

Paper: ZeroSearch - Incentivar la capacidad de búsqueda de LLMs sin búsqueda

El artículo presenta el ZeroSearch, un método de aprendizaje por refuerzo que mejora las capacidades de búsqueda de LLMs sin interactuar directamente con motores de búsqueda reales, simulando la interacción a través de LLMs ajustados para generar documentos relevantes y ruidosos, y utiliza una estrategia de rollout curricular para aumentar progresivamente la dificultad de los escenarios de búsqueda.

¡Esto es absolutamente brillante! Imaginen: entrenar modelos para buscar sin necesidad de motores de búsqueda reales. Es como enseñar a alguien a conducir en un simulador antes de poner las manos en un coche verdadero. La eficiencia de recursos aquí es extraordinaria, y estoy seguro de que este enfoque abrirá camino a LLMs mucho más capaces y autónomos en el futuro cercano.

Fuente original

Paper: Zero absoluto - razonamiento de autorreproducción reforzado con datos cero

El artículo presenta el «Absolute Zero Reasoner» (AZR), un nuevo paradigma de aprendizaje por refuerzo con recompensas verificables (RLVR) que busca mejorar las capacidades de razonamiento de modelos de lenguaje, aprendiendo directamente de recompensas basadas en resultados, sin supervisión humana o datos externos. El AZR evoluciona su currículo de entrenamiento y capacidad de razonamiento usando un ejecutor de código para validar tareas de razonamiento de código y verificar respuestas, actuando como una fuente unificada de recompensa verificable para orientar el aprendizaje.

Es curioso cómo estamos logrando cada vez más enseñar a los modelos a «pensar por sí mismos». El concepto de un modelo que aprende sin input humano es casi como ver a un niño descubriendo el mundo solo – solo que en este caso, a una velocidad exponencial. Este tipo de avance puede ser lo que nos lleve a una AI verdaderamente autónoma en las próximas iteraciones.

Fuente original


¡Y eso es todo por esta semana, amigos! Qué semana intensa en el mundo de la tecnología, ¿verdad? Desde avances en la forma en que entrenamos modelos de AI hasta las grandes maniobras estratégicas de las gigantes tecnológicas, quedó claro que estamos en un período de aceleración y transformación sin precedentes.

Lo más interesante fueron los desarrollos en Apple, que parece estar finalmente abrazando la revolución de la AI, y los cambios estructurales en OpenAI, que continúan definiendo cómo se desarrollará e implementará la AI. Mientras tanto, la carrera entre Google y OpenAI sigue calentándose, con ambas empresas lanzando nuevos recursos a un ritmo vertiginoso.

Hasta la próxima semana, ¡sigan curiosos y manténganse actualizados! El tren de la tecnología no para – y nosotros tampoco.


Últimos artículos relacionados