
Café da Semana
A ascensão da AI Generativa: Inovações, controvérsias e o futuro da criação
E lá vamos nós para mais uma semana agitada no mundo da AI! Se piscou, provavelmente perdeu umas três ou quatro novidades importantes - este campo move-se à velocidade da luz, não é? Temos um pouco de tudo esta semana, por isso, pega no teu café preferido, instala-te na cadeira e vamos mergulhar nas notícias mais quentes da semana!
Meta aposta na energia Nuclear para alimentar os seus sonhos de AI
Parece que a Meta está à procura de uma fonte de energia um bocadinho mais potente do que simplesmente ligar os seus servidores à tomada! A empresa anunciou que está a procurar adicionar entre 1 e 4 gigawatts de nova capacidade de geração nuclear nos EUA, a partir do início da década de 2030. E não é para menos: o consumo de energia dos centros de dados nos EUA deverá quase triplicar até 2030 , exigindo cerca de 47 gigawatts de nova capacidade. Para terem uma ideia, isto é mais ou menos a capacidade de 47 centrais nucleares de média dimensão!
A decisão da Meta é bastante interessante e mostra como as big techs estão a começar a encarar de frente o elefante na sala: a AI consome uma quantidade absurda de energia. É como se tivéssemos criado um adolescente digital que não para de crescer e que agora precisa de um prato de comida cada vez maior. A energia nuclear pode ser uma solução interessante, uma vez que é limpa e fiável, mas também traz os seus próprios desafios e preocupações. Será que outras empresas vão seguir o mesmo caminho? Só o tempo o dirá! Isto também me lembra da péssima decisáo da Alemanha de acabar com todas as suas centrais de energia nuclear, o que faz o país ficar de fora de possíveis locais para datacenters de AI na Europa e os deixou numa situação complicada com a guerra da ucrânia, já que a ideia era acabar com as centrais e consumir o gás da Rússia...
Drama na OpenAI: Elon Musk processa e ChatGPT ganha versão premium
A OpenAI está a ter uma semana e tanto! Por um lado, Elon Musk interpôs um processo contra a empresa, alegando que esta abandonou a sua missão original sem fins lucrativos e o deixou no prejuízo de 44 milhões de dólares que tinha doado. Musk acusa ainda a empresa de práticas anticoncorrenciais que estariam a prejudicar a sua nova empresa de AI, a xAI. Do outro lado, a OpenAI lançou o ChatGPT Pro, um plano mensal de 200 dólares que dá acesso ilimitado aos seus modelos mais avançados, incluindo o OpenAI o1 e outras ferramentas premium.
É engraçado como o mundo da AI às vezes parece uma novela mexicana, não é? Temos drama, traição, dinheiro e uma boa dose de ironias do destino. O processo do Musk levanta questões importantes sobre o futuro da AI e como equilibrar o desenvolvimento tecnológico com a responsabilidade ética. Entretanto, o ChatGPT Pro mostra que existe um mercado sedento por características mais avançadas de AI, mesmo que o preço seja algo salgado. É como se a OpenAI estivesse a dizer: "Queres o filet mignon da AI? Vais ter de pagar!"
Fonte original 1 / Fonte original 2
Google e Tencent entram na luta dos vídeos gerados por AI
A corrida pela supremacia na geração de vídeos com AI está a aquecer! A Google apresentou o Veo, o seu novo modelo capaz de gerar vídeos a 1080p a partir de texto ou imagens, disponível através da plataforma Vertex AI. Não querendo ficar atrás, a Tencent lançou o HunyuanVideo, um modelo de código aberto que promete competir de igual para igual com as soluções proprietárias. O diferencial do HunyuanVideo está na sua arquitetura unificada para a geração de imagens e vídeos.
É impressionante como a geração de vídeo por AI está a evoluir rapidamente. Há alguns anos, conseguir que uma AI gerasse imagens decentes já era um feito e tanto. Agora, estamos a falar de vídeos em alta definição! É como se tivéssemos passado da era do cinema mudo diretamente para o IMAX. O mais giro é ver empresas de diferentes partes do mundo a contribuir para este avanço, cada uma com a sua abordagem única. Mal posso esperar para ver o que os criadores de conteúdo vão fazer com estas ferramentas!
Fonte original 1 / Fonte original 2
DeepMind cria mundos virtuais "infinitos" com Genie 2
A DeepMind acaba de revelar algo que parece saído de um filme de ficção científica: o Genie 2, um modelo de AI capaz de criar mundos 3D interativos que se assemelham a jogos AAA. O mais impressionante é que o faz a partir de uma única imagem e de uma descrição em texto. Os utilizadores podem explorar estes mundos, saltando e interagindo com NPCs, como se estivessem num videojogo real.
Isto é simplesmente maluco! É como se a DeepMind tivesse dado à AI uma varinha mágica capaz de transformar qualquer ideia num mundo interativo. É claro que existem questões importantes sobre os direitos de autor, uma vez que o modelo foi treinado com jogadas de videojogos populares. Mas não se pode negar o potencial revolucionário desta tecnologia. Imaginem só poder criar um protótipo de jogo instantaneamente, apenas descrevendo a vossa ideia? Os game designers devem estar a ter sonhos (ou pesadelos) com as possibilidades!
Hugging Face alerta para modelos de AI chineses
Clement Delangue, CEO da Hugging Face, levantou uma questão sensível sobre a utilização de modelos de AI de código aberto chineses por empresas ocidentais. A principal preocupação está relacionada com a censura imposta pelo governo chinês e como esta poderá influenciar estes modelos. Delangue defende que, se a China se tornar dominante na área da AI, os aspetos culturais específicos de cada país poderão ser propagados globalmente através destes modelos.
É uma situação complicada que nos faz pensar sobre como a AI se pode tornar num campo de batalha cultural e geopolítico. É como se estivéssemos a assistir a um jogo de xadrez à escala global, onde cada movimento tem implicações profundas para o futuro da tecnologia e da sociedade. A questão não é simplesmente técnica, mas envolve valores, liberdade de expressão e diversidade cultural. Mas para mim também cheira ao medo da China superar os Estados Unidos.
Spotify e Google unem-se para criar podcasts de AI personalizados
O Spotify Wrapped 2024 trouxe uma novidade interessante: um podcast de AI criado em parceria com o NotebookLM da Google. A ideia é utilizar dois apresentadores virtuais para analisar o histórico musical do utilizador, criando uma experiência de podcast totalmente personalizada. Os logótipos das duas empresas surgem lado a lado, marcando uma colaboração significativa no mundo do entretenimento digital.
Que ideia genial! É como ter um programa de rádio privado que conhece todos os seus gostos musicais. A parceria entre o Spotify e a Google mostra como a AI pode criar experiências únicas e pessoais. Imagine só ter apresentadores virtuais a discutir por que razão ouviu aquela música triste 47 vezes depois do fim do namoro? Pode ser um pouco assustador, mas também muito divertido!
Microsoft revoluciona o RAG com o LazyGraphRAG
A Microsoft Research apresentou uma nova abordagem para a Retrieval Augmented Generation (RAG) chamada LazyGraphRAG. A novidade elimina a necessidade de sumarização prévia dos dados de origem, reduzindo significativamente os custos de indexação. O sistema combina o melhor dos mundos entre o RAG vetorial e o RAG baseado em grafos, oferecendo melhor qualidade e eficiência de custos.
A Microsoft conseguiu fazer com que o RAG "preguiçoso" funcionasse melhor! É aquela história do colaborador que encontra a forma mais eficiente de fazer as coisas para poder relaxar depois. Brincadeiras à parte, esta inovação pode tornar o RAG muito mais acessível e prático para empresas de todas as dimensões. É como ter um assistente super eficiente que não precisa de fazer anotações prévias para responder às suas perguntas. Aqui na Yes ainda não utilizamos qualquer tipo de RAG, mas esta técnica, definitivamente, tem de entrar nos nossos radares.
Google lança PaliGemma 2: Visão e linguagem em perfeita harmonia
O PaliGemma 2 chegou como a nova geração de modelos de linguagem visual da Google. Construído com base nos já impressionantes modelos Gemma 2, acrescenta capacidades visuais avançadas e facilidade de ajuste fino. O modelo pode ver, compreender e interagir com entradas visuais de forma mais natural e eficiente do que nunca.
A Google deu um óculos super-poderoso à sua AI! O PaliGemma 2 promete tornar a AI visual mais acessível para os programadores, o que pode levar a uma explosão de aplicações inovadoras. Imagina só as possibilidades: desde ajudar pessoas com deficiência visual até criar experiências interativas totalmente novas. É o tipo de avanço que nos faz questionar: o que mais é que a AI vai aprender a ver?
OpenAI e Anduril unem-se para proteger forças armadas dos EUA
Numa parceria que parece saída de um filme de ficção científica, a OpenAI e a Anduril Industries anunciaram uma colaboração estratégica para desenvolver soluções de AI para missões de segurança nacional. A parceria vai combinar os modelos avançados da OpenAI com os sistemas de defesa de alta performance da Anduril para melhorar a proteção do pessoal militar americano e dos aliados contra ataques de drones e outros dispositivos aéreos.
A AI está a deixar de ser apenas aquela assistente que te ajuda a escrever emails para entrares em território bem mais sério. A parceria mostra como a tecnologia pode ser utilizada para salvar vidas, mesmo que o contexto militar levante sempre questões éticas importantes. Mas ainda assim, mantenho-me cético quanto ao uso que os EUA vão dar a isto tudo.
Google DeepMind revoluciona previsão do tempo com GenCast
A Google DeepMind apresentou o GenCast, o seu novo modelo de AI de alta resolução que promete superar os sistemas meteorológicos tradicionais. O modelo consegue fornecer melhores previsões tanto para o clima do dia-a-dia como para eventos extremos, com até 15 dias de antecedência. O mais giro? Estão a disponibilizar o código do modelo para a comunidade científica.
Parece que a AI finalmente descobriu como fazer algo que os humanos tentam há séculos: prever o tempo com mais precisão! Imaginem só não ter de carregar mais chapeu de chuva "só por via das dúvidas" quando a app diz que vai estar sol? Mas, infelizmente, continuo a não acreditar em previsões meteorológicas.
AWS lança verificação automática para evitar alucinações nas AI
A Amazon Web Services adicionou uma nova ferramenta ao Amazon Bedrock Guardrails: as Verificações de Raciocínio Automatizado. O sistema utiliza processos matemáticos e lógicos para garantir que as respostas geradas por modelos de linguagem grandes (LLMs) estão alinhadas com factos conhecidos e não são baseadas em dados fabricados ou inconsistentes.
Finalmente alguém criou uma "coleira" para as alucinações das AI! A AWS desenvolveu um detetor de mentiras digital - mas em vez de medir os batimentos cardíacos, verifica a matemática por detrás das respostas. Nada mais de IAs a inventar receitas de bolos com ingredientes que não existem ou a citar artigos científicos imaginários!
Fundadores do NotebookLM abandonam a Google para nova aventura
Três membros-chave da equipa do NotebookLM da Google, incluindo a líder da equipa e o designer, anunciaram a sua saída para criar uma nova startup. Ainda em modo stealth total, a startup promete criar algo que utilize os mais recentes modelos de AI para construir ferramentas úteis para pessoas comuns.
É aquela velha história: depois de criar algo super giro dentro de uma big tech, a malta pensa "E se fizéssemos isto à nossa maneira?". Exatamente quando chefs experientes decidem abrir o seu próprio restaurante depois de trabalharem no melhor da cidade. Mal posso esperar para ver que prato - ups, produto - vão criar!
ChatGPT bloqueia ao ouvir determinados nomes e OpenAI admite falha na ferramenta de privacidade
Um fenómeno curioso chamou a atenção dos utilizadores do ChatGPT no passado fim de semana: o chatbot simplesmente deixa de funcionar quando alguém menciona o nome "David Mayer". Mas não é só ele - outros nomes como Brian Hood, Jonathan Turley e Jonathan Zittrain também causam o mesmo efeito. A OpenAI confirmou que isto acontece por causa de uma ferramenta interna de privacidade que acabou por ficar um bocadinho... demasiado sensível.
Imagine só: está numa conversa super produtiva com a AI e, de repente, ela dá aquela travada básica só porque mencionou um nome específico. É como quando o teu computador dá ecrã azul, só que mais seletivo. O mais engraçado é que a OpenAI está tipo: "Ups, a nossa ferramenta de privacidade acordou hoje com o pé esquerdo!"
AWS lança nova família de Modelos de AI com foco no custo-benefício
A AWS apresentou a sua nova linha de modelos de AI denominada Amazon Nova, oferecendo três variantes: Micro, Lite e Pro. O Micro é focado em texto e super rápido, o Lite é multimodal e económico, e o Pro é o modelo mais capaz, combinando precisão, velocidade e custo. O mais giro? Todos suportam mais de 200 idiomas e podem ser facilmente integrados com dados proprietários.
A AWS é aquela loja que tem uma opção para todos os bolsos: quer algo básico? Pega no Micro. Precisa de algo mais robusto? Vai de Pro! É como escolher entre um pingado, um carioca ou um galão, só que em vez de cafeína, está a comprar poder computacional.
A cada semana que passa, o mundo da AI surpreende-nos com inovações que parecem desafiar os limites do possível. Desde as preocupações com o consumo de energia até à criação de mundos virtuais interativos, estamos a assistir a uma verdadeira revolução tecnológica. O mais incrível é que, mesmo com tantas novidades, ainda temos aquela sensação de que estamos apenas a arranhar a superfície. É como se a cada semana abríssemos uma porta nova e encontrássemos outras dez portas misteriosas atrás dela. Mal posso esperar para ver que surpresas nos reserva a próxima semana - só espero que nenhuma delas envolva AIs a terem alergias a mais nomes!