Café de la semana

El auge de la IA generativa: innovaciones, controversias y el futuro de la creación

Walter Gandarella • 14 de diciembre de 2024

¡Y allá vamos para otra semana agitada en el mundo de la AI! Si parpadeaste, probablemente perdiste unas tres o cuatro novedades importantes - ¡este campo se mueve a la velocidad de la luz, ¿no?! Tenemos un poco de todo esta semana, así que agarra tu café favorito, instálate en la silla y vamos a sumergirnos en las noticias más candentes de la semana!

Meta apuesta por la energía nuclear para alimentar sus sueños de AI

Parece que Meta está buscando una fuente de energía un poco más potente que simplemente enchufar sus servidores a la toma de corriente. La empresa anunció que está buscando añadir entre 1 y 4 gigavatios de nueva capacidad de generación nuclear en EE. UU., a partir de principios de la década de 2030. Y no es para menos: el consumo de energía de los centros de datos en EE. UU. debería casi triplicarse para 2030, exigiendo alrededor de 47 gigavatios de nueva capacidad. Para que tengan una idea, esto es más o menos la capacidad de 47 centrales nucleares de tamaño medio.

La decisión de Meta es bastante interesante y muestra cómo las grandes tecnológicas están comenzando a enfrentar de frente el elefante en la habitación: la AI consume una cantidad absurda de energía. Es como si hubiéramos creado un adolescente digital que no para de crecer y que ahora necesita un plato de comida cada vez más grande. La energía nuclear puede ser una solución interesante, ya que es limpia y fiable, pero también trae sus propios desafíos y preocupaciones. ¿Seguirán otras empresas el mismo camino? ¡Solo el tiempo lo dirá! Esto también me recuerda la pésima decisión de Alemania de cerrar todas sus centrales nucleares, lo que deja al país fuera de posibles ubicaciones para centros de datos de AI en Europa y los deja en una situación complicada con la guerra en Ucrania, ya que la idea era cerrar las centrales y consumir gas de Rusia...

Fuente original

Drama en OpenAI: Elon Musk demanda y ChatGPT lanza versión premium

OpenAI está teniendo una semana intensa. Por un lado, Elon Musk interpuso una demanda contra la empresa, alegando que esta abandonó su misión original sin fines de lucro y lo dejó con una pérdida de 44 millones de dólares que había donado. Musk también acusa a la empresa de prácticas anticompetitivas que estarían perjudicando su nueva empresa de AI, xAI. Por otro lado, OpenAI lanzó ChatGPT Pro, un plan mensual de 200 dólares que da acceso ilimitado a sus modelos más avanzados, incluyendo OpenAI o1 y otras herramientas premium.

Es curioso cómo el mundo de la AI a veces parece una telenovela mexicana, ¿no? Tenemos drama, traición, dinero y una buena dosis de ironías del destino. La demanda de Musk plantea cuestiones importantes sobre el futuro de la AI y cómo equilibrar el desarrollo tecnológico con la responsabilidad ética. Mientras tanto, ChatGPT Pro muestra que existe un mercado ávido de características más avanzadas de AI, incluso si el precio es algo elevado. Es como si OpenAI estuviera diciendo: "¿Quieres el filet mignon de la AI? ¡Tendrás que pagar!"

Fuente original 1 / Fuente original 2

Google y Tencent entran en la lucha de los vídeos generados por AI

¡La carrera por la supremacía en la generación de vídeos con AI se está calentando! Google presentó Veo, su nuevo modelo capaz de generar vídeos a 1080p a partir de texto o imágenes, disponible a través de la plataforma Vertex AI. No queriendo quedarse atrás, Tencent lanzó HunyuanVideo, un modelo de código abierto que promete competir en igualdad de condiciones con las soluciones propietarias. La diferencia de HunyuanVideo radica en su arquitectura unificada para la generación de imágenes y vídeos.

Es impresionante cómo la generación de vídeo por AI está evolucionando rápidamente. Hace unos años, lograr que una AI generara imágenes decentes ya era un gran logro. ¡Ahora estamos hablando de vídeos en alta definición! Es como si hubiéramos pasado de la era del cine mudo directamente al IMAX. Lo más interesante es ver a empresas de diferentes partes del mundo contribuyendo a este avance, cada una con su enfoque único. ¡No puedo esperar a ver lo que los creadores de contenido harán con estas herramientas!

Fuente original 1 / Fuente original 2

DeepMind crea mundos virtuales "infinitos" con Genie 2

DeepMind acaba de revelar algo que parece salido de una película de ciencia ficción: Genie 2, un modelo de AI capaz de crear mundos 3D interactivos que se asemejan a juegos AAA. Lo más impresionante es que lo hace a partir de una sola imagen y una descripción en texto. Los usuarios pueden explorar estos mundos, saltando e interactuando con NPCs, como si estuvieran en un videojuego real.

¡Esto es simplemente una locura! Es como si DeepMind le hubiera dado a la IA una varita mágica capaz de transformar cualquier idea en un mundo interactivo. Por supuesto, hay cuestiones importantes sobre los derechos de autor, ya que el modelo fue entrenado con movimientos de videojuegos populares. Pero no se puede negar el potencial revolucionario de esta tecnología. ¿Se imaginan poder crear un prototipo de juego instantáneamente, solo describiendo su idea? ¡Los diseñadores de juegos deben estar teniendo sueños (o pesadillas) con las posibilidades!

Fuente original

Hugging Face alerta sobre modelos de IA chinos

Clement Delangue, CEO de Hugging Face, planteó una cuestión sensible sobre el uso de modelos de IA de código abierto chinos por empresas occidentales. La principal preocupación está relacionada con la censura impuesta por el gobierno chino y cómo esto podría influir en estos modelos. Delangue sostiene que, si China se convierte en dominante en el área de la IA, los aspectos culturales específicos de cada país podrían ser propagados globalmente a través de estos modelos.

Es una situación complicada que nos hace reflexionar sobre cómo la IA puede convertirse en un campo de batalla cultural y geopolítico. Es como si estuviéramos presenciando una partida de ajedrez a escala global, donde cada movimiento tiene profundas implicaciones para el futuro de la tecnología y la sociedad. La cuestión no es simplemente técnica, sino que involucra valores, libertad de expresión y diversidad cultural. Pero para mí también huele a miedo de que China supere a Estados Unidos.

Fuente original

Spotify y Google se unen para crear podcasts de IA personalizados

El Spotify Wrapped 2024 trajo una novedad interesante: un podcast de IA creado en colaboración con NotebookLM de Google. La idea es utilizar dos presentadores virtuales para analizar el historial musical del usuario, creando una experiencia de podcast totalmente personalizada. Los logotipos de ambas empresas aparecen uno al lado del otro, marcando una colaboración significativa en el mundo del entretenimiento digital.

¡Qué idea genial! Es como tener un programa de radio privado que conoce todos tus gustos musicales. La asociación entre Spotify y Google muestra cómo la IA puede crear experiencias únicas y personales. ¿Te imaginas tener presentadores virtuales discutiendo por qué escuchaste esa canción triste 47 veces después de una ruptura? Puede ser un poco aterrador, ¡pero también muy divertido!

Fuente original

Microsoft revoluciona el RAG con LazyGraphRAG

Microsoft Research presentó un nuevo enfoque para la Generación Aumentada por Recuperación (RAG) llamado LazyGraphRAG. La novedad elimina la necesidad de resumir previamente los datos de origen, reduciendo significativamente los costos de indexación. El sistema combina lo mejor de los mundos entre el RAG vectorial y el RAG basado en grafos, ofreciendo mejor calidad y eficiencia de costos.

¡Microsoft ha logrado que el RAG "perezoso" funcione mejor! Es esa historia del empleado que encuentra la forma más eficiente de hacer las cosas para poder relajarse después. Bromas aparte, esta innovación puede hacer que el RAG sea mucho más accesible y práctico para empresas de todos los tamaños. Es como tener un asistente súper eficiente que no necesita hacer anotaciones previas para responder a tus preguntas. Aquí en Yes aún no utilizamos ningún tipo de RAG, pero esta técnica, definitivamente, tiene que entrar en nuestros radares.

Fuente original

Google lanza PaliGemma 2: Visión y lenguaje en perfecta armonía

El PaliGemma 2 llegó como la nueva generación de modelos de lenguaje visual de Google. Construido sobre los ya impresionantes modelos Gemma 2, añade capacidades visuales avanzadas y facilidad de ajuste fino. El modelo puede ver, comprender e interactuar con entradas visuales de manera más natural y eficiente que nunca.

¡Google le ha dado unas gafas superpoderosas a su IA! El PaliGemma 2 promete hacer que la IA visual sea más accesible para los programadores, lo que puede llevar a una explosión de aplicaciones innovadoras. Imagina las posibilidades: desde ayudar a personas con discapacidad visual hasta crear experiencias interactivas totalmente nuevas. Es el tipo de avance que nos hace cuestionar: ¿qué más aprenderá a ver la IA?

Fuente original

OpenAI y Anduril se unen para proteger las fuerzas armadas de EE. UU.

En una asociación que parece sacada de una película de ciencia ficción, OpenAI y Anduril Industries anunciaron una colaboración estratégica para desarrollar soluciones de IA para misiones de seguridad nacional. La asociación combinará los modelos avanzados de OpenAI con los sistemas de defensa de alto rendimiento de Anduril para mejorar la protección del personal militar estadounidense y de los aliados contra ataques de drones y otros dispositivos aéreos.

La IA está dejando de ser solo esa asistente que te ayuda a escribir correos electrónicos para entrar en un terreno mucho más serio. La asociación muestra cómo la tecnología puede ser utilizada para salvar vidas, aunque el contexto militar siempre plantea importantes cuestiones éticas. Pero aun así, me mantengo escéptico respecto al uso que EE. UU. dará a todo esto.

Fuente original

Google DeepMind revoluciona la previsión del tiempo con GenCast

Google DeepMind presentó GenCast, su nuevo modelo de IA de alta resolución que promete superar los sistemas meteorológicos tradicionales. El modelo puede proporcionar mejores previsiones tanto para el clima cotidiano como para eventos extremos, con hasta 15 días de antelación. ¿Lo más interesante? Están poniendo a disposición el código del modelo para la comunidad científica.

Parece que la IA finalmente ha descubierto cómo hacer algo que los humanos han intentado durante siglos: ¡predecir el tiempo con más precisión! ¿Se imaginan no tener que llevar más paraguas "por si acaso" cuando la app dice que hará sol? Pero, desafortunadamente, sigo sin creer en las previsiones meteorológicas.

Fuente original

AWS lanza verificación automática para evitar alucinaciones en la IA

Amazon Web Services ha añadido una nueva herramienta a Amazon Bedrock Guardrails: las Verificaciones de Raciocinio Automatizado. El sistema utiliza procesos matemáticos y lógicos para garantizar que las respuestas generadas por modelos de lenguaje grandes (LLMs) están alineadas con hechos conocidos y no se basan en datos fabricados o inconsistentes.

¡Finalmente alguien ha creado una "correa" para las alucinaciones de la IA! AWS ha desarrollado un detector de mentiras digital, pero en lugar de medir los latidos del corazón, verifica la matemática detrás de las respuestas. ¡Nada de IA inventando recetas de pasteles con ingredientes que no existen o citando artículos científicos imaginarios!

Fuente original

Fundadores de NotebookLM abandonan Google para una nueva aventura

Tres miembros clave del equipo de NotebookLM de Google, incluida la líder del equipo y el diseñador, anunciaron su salida para crear una nueva startup. Aún en modo sigiloso total, la startup promete crear algo que utilice los modelos de IA más recientes para construir herramientas útiles para personas comunes.

Es esa vieja historia: después de crear algo super interesante dentro de una gran empresa tecnológica, la gente piensa "¿Y si hiciéramos esto a nuestra manera?". Exactamente como cuando chefs experimentados deciden abrir su propio restaurante después de trabajar en el mejor de la ciudad. ¡No puedo esperar a ver qué plato - ups, producto - van a crear!

Fuente original

ChatGPT se bloquea al escuchar ciertos nombres y OpenAI admite falla en la herramienta de privacidad

Un fenómeno curioso llamó la atención de los usuarios de ChatGPT el pasado fin de semana: el chatbot simplemente deja de funcionar cuando alguien menciona el nombre "David Mayer". Pero no es solo él: otros nombres como Brian Hood, Jonathan Turley y Jonathan Zittrain también causan el mismo efecto. OpenAI confirmó que esto sucede debido a una herramienta interna de privacidad que terminó siendo un poco... demasiado sensible.

Imaginen esto: estás en una conversación super productiva con la IA y, de repente, ella se congela solo porque mencionaste un nombre específico. Es como cuando tu computadora se queda en pantalla azul, solo que más selectivo. Lo más gracioso es que OpenAI está como: "Ups, ¡nuestra herramienta de privacidad se despertó hoy con el pie izquierdo!"

Fuente original

AWS lanza nueva familia de Modelos de IA con enfoque en la relación costo-beneficio

AWS presentó su nueva línea de modelos de IA denominada Amazon Nova, ofreciendo tres variantes: Micro, Lite y Pro. El Micro está enfocado en texto y es super rápido, el Lite es multimodal y económico, y el Pro es el modelo más capaz, combinando precisión, velocidad y costo. ¿Lo más interesante? Todos soportan más de 200 idiomas y pueden ser fácilmente integrados con datos propietarios.

AWS es esa tienda que tiene una opción para todos los bolsillos: ¿quieres algo básico? Toma el Micro. ¿Necesitas algo más robusto? ¡Ve por el Pro! Es como elegir entre un café con leche, un carioca o un galão, solo que en lugar de cafeína, estás comprando poder computacional.

Fuente original

A cada semana que pasa, el mundo de la IA nos sorprende con innovaciones que parecen desafiar los límites de lo posible. Desde las preocupaciones por el consumo de energía hasta la creación de mundos virtuales interactivos, estamos siendo testigos de una verdadera revolución tecnológica. Lo más increíble es que, incluso con tantas novedades, todavía tenemos esa sensación de que solo estamos rascando la superficie. Es como si cada semana abriéramos una puerta nueva y encontráramos otras diez puertas misteriosas detrás de ella. No puedo esperar para ver qué sorpresas nos depara la próxima semana; solo espero que ninguna de ellas involucre a las IA teniendo alergias a más nombres.

Últimos artículos relacionados

ferramentasAIdesenvolvimento

Café da Semana

A semana que a AI decidiu fazer das suas

Walter Gandarella • 18 de agosto de 2025

ferramentasAIweb

Café da Semana

Esta semana vai fazer-te repensar o futuro da AI

Walter Gandarella • 10 de junio de 2025