
Café da Semana
Da simulação de pesquisas à reestruturação das gigantes tecnológicas
Olá, caros leitores do DevCafé! Cá estamos com mais uma edição quentinha do nosso resumo semanal, repleto das notícias mais relevantes do universo tecnológico. Esta semana foi agitada, com desenvolvimentos fascinantes desde novos métodos de treino de AI até às grandes manobras das gigantes tecnológicas. Vamos dar uma olhada naquilo que mais se destacou nos últimos dias? Preparem o vosso café e acomodem-se!
Imitação visual permite o controlo contextual de humanoides
VideoMimic é um sistema real-para-sim-para-real que transforma vídeos em habilidades transferíveis para humanoides, permitindo que robôs aprendam comportamentos contextuais (atravessar terrenos, escalar, sentar) numa única política. O sistema reconstrói humanos e ambientes a partir de vídeos, produzindo políticas de controlo de corpo inteiro para robôs humanoides realizarem tarefas como subir escadas, sentar em cadeiras e atravessar terrenos diversos. A abordagem oferece um caminho escalável para ensinar humanoides a operar em ambientes reais.
Vá lá, isto parece mesmo saído de um filme de ficção científica! A capacidade de um robô aprender apenas observando vídeos é um passo gigante para a robótica. Imaginem só os humanoides da Boston Dynamics a aprenderem parkour só de olhar para vídeos do YouTube? Daqui a nada temos robôs a desafiarem-nos para uma partida de futebol, e provavelmente a ganharem!
Stripe cria modelo de base de pagamentos baseado em transformadores
A Stripe criou um modelo de base de pagamentos baseado em transformadores, que utiliza aprendizagem automática em caraterísticas discretas para melhorar os produtos da empresa. Este modelo aprende vetores de propósito geral para cada transação, destilando os principais sinais de cada cobrança numa única incorporação versátil. A Stripe construiu um classificador que ingere sequências de incorporações do modelo de base e prevê se a fatia de tráfego está sob ataque, permitindo bloquear ataques antes que atinjam as empresas. Esta abordagem melhorou a taxa de deteção de ataques de teste de cartões em grandes utilizadores de 59% para 97% da noite para o dia.
A Stripe continua a mostrar por que é uma das empresas mais inovadoras no espaço fintech. Conseguir aumentar a deteção de fraudes de 59% para 97% é um ganho monumental. Este tipo de melhoria não só beneficia a Stripe, mas todo o ecossistema digital. Imaginem a quantidade de dinheiro e dores de cabeça que isto vai poupar a comerciantes de todo o mundo. Bravo!
CEO da IBM diz que AI substituiu centenas de trabalhadores, mas criou novos empregos de programação e vendas
O CEO da IBM, Arvind Krishna, afirmou que a empresa usou inteligência artificial para substituir o trabalho de algumas centenas de funcionários de recursos humanos, mas, como resultado, contratou mais programadores e vendedores. Krishna acredita que os impactos da AI na força de trabalho são a capacidade de realizar tarefas como analisar planilhas, conduzir pesquisas e rascunhar e-mails de forma autónoma.
É o eterno debate da AI em ação: por um lado elimina postos de trabalho, por outro cria novas oportunidades. Embora eu acredite nesta transformação, fico sempre a pensar nos profissionais afetados. Será que um especialista em RH consegue transformar-se facilmente num programador ou vendedor? A história ensina-nos que a adaptação acontece, mas não sem dor para muitas pessoas no processo.
Trump vai revogar restrições globais a chips e preparar novas restrições à AI
A administração Trump planeia revogar algumas restrições a chips de inteligência artificial da era Biden como parte de um esforço mais amplo para rever as restrições comerciais globais de semicondutores que têm atraído forte oposição de grandes empresas de tecnologia e governos estrangeiros.
Interessante esta reviravolta. Depois de anos de aperto nas restrições, parece que o vento está a mudar de direção. Embora a flexibilização de restrições possa acelerar a inovação, temos de estar atentos a potenciais riscos de segurança. O equilíbrio entre avanço tecnológico e controlo estratégico é delicado, e será interessante ver que novas restrições à AI serão propostas em contrapartida.
Suno lança o v4.5 para assinantes Pro & Premier
O Suno lançou a versão 4.5, que oferece uma gama mais ampla de géneros, vocais mais ricos e melhor compreensão dos prompts para músicas. A nova versão inclui: géneros expandidos e mashups mais inteligentes, vozes melhoradas, som mais complexo e texturizado, melhor adesão aos prompts, ajuda de melhoria de prompts, Covers + Personas atualizados, Covers + Personas combináveis, duração de música estendida e áudio melhorado.
O Suno continua a surpreender-me a cada atualização, estamos cada vez mais próximos de um ponto onde não conseguiremos distinguir entre música gerada por AI e música criada por humanos. Esta democratização da criação musical é revolucionária, mas também levanta questões sobre o futuro dos músicos profissionais. Confesso que já estou a criar algumas músicas para as minhas festas em casa e para as crianças – é divertidíssimo.
Netflix estreia a sua ferramenta de pesquisa generativa alimentada por AI
A Netflix lançou uma nova ferramenta de pesquisa alimentada por AI que utiliza o ChatGPT da OpenAI para fornecer aos utilizadores uma experiência de descoberta conversacional. A funcionalidade será lançada esta semana para utilizadores iOS como uma versão beta opcional, com subscritores na Austrália e Nova Zelândia já a terem acesso à mesma. Outras plataformas de streaming também estão a aproveitar a AI generativa para pesquisa, como a Amazon com a sua pesquisa por voz AI nas Fire TVs. A Netflix também planeia usar AI generativa para atualizar os títulos em diferentes idiomas, e outras funcionalidades reveladas incluem um feed de vídeos curtos para utilizadores móveis e uma reformulação da página inicial da TV.
Finalmente alguém resolveu o problema de encontrar algo para ver na Netflix. Quantas vezes já perdemos 30 minutos à procura do filme perfeito? A integração do ChatGPT parece ser exatamente o que precisávamos – «mostra-me um thriller psicológico com uma reviravolta no final» é mil vezes melhor do que navegar por categorias infinitas. Agora só falta resolver o problema de eu adormecer a meio do filme que demorei tanto tempo a escolher...
Microsoft revela «nova geração de experiências do Windows» - aqui está o que está a caminho do Windows 11 e PCs Copilot+
A Microsoft anunciou uma série de novas funcionalidades para o Windows 11 e PCs Copilot+, incluindo melhorias orientadas para AI no Explorador de Ficheiros, Paint, Fotos e Ferramenta de Recortes. As novas funcionalidades serão lançadas para Windows Insiders nas próximas semanas e meses, algumas exclusivas para PCs Copilot+.
A Microsoft está claramente a apostar todas as suas fichas na integração de AI. O Windows sempre foi um sistema operativo algo conservador nas suas atualizações, mas parece que finalmente estamos a ver uma mudança de paradigma. Espero sinceramente que estas novas funcionalidades sejam mais do que apenas truques de marketing e tragam benefícios reais de produtividade. E, vá lá, que o Paint com AI não se torne no novo clippy.
Apple usa Anthropic para programação de AI enquanto os desenvolvedores aguardam o Swift Assist
A Apple está a colaborar com a Anthropic para integrar o Claude no Xcode, o ambiente de desenvolvimento integrado da Apple, com o objetivo de melhorar o seu fluxo de trabalho interno, acelerar e modernizar o desenvolvimento de produtos através da AI, semelhante a empresas como a Windsurf e a Cursor maker Anysphere. A Apple ainda não decidiu se lançará a versão do Xcode com integração Claude externamente. Este movimento surge enquanto a Apple procura impulsionar a sua Apple Intelligence e adotar ferramentas de AI da indústria.
A Apple a adotar AI de outra empresa? Isto sim é um braking news! A empresa de Cupertino sempre preferiu desenvolver tudo internamente, por isso esta parceria com a Anthropic mostra o quão seriamente estão a levar a corrida da AI. Os desenvolvedores que utilizam Swift devem estar com água na boca, mas conhecendo a Apple, devem preparar-se para uma longa espera até que estas ferramentas cheguem ao público.
Apple pondera mudança para a pesquisa com AI, terminando uma era definida pela Google
A Apple está a explorar opções de pesquisa com inteligência artificial, numa mudança para se afastar da Google. A Apple Inc. está «ativamente a analisar» a remodelação do navegador Safari nos seus dispositivos para se concentrar em motores de pesquisa alimentados por AI, uma mudança sísmica para a indústria, apressada pelo potencial fim de uma parceria de longa data com a Google.
Ui, isto é tremendo. A Google paga biliões à Apple para ser o motor de busca predefinido no Safari, por isso esta mudança representaria não só uma revolução tecnológica mas também um golpe financeiro massivo. Estou ansioso para ver que solução a Apple vai apresentar – um Safari com AI nativa poderia finalmente dar ao navegador da Apple a relevância que nunca conseguiu alcançar face ao Chrome.
Google pode treinar a pesquisa de AI com conteúdo web mesmo após a exclusão da AI
O Google pode treinar os seus produtos de AI específicos para pesquisa, como o AI Overviews, com conteúdo da web, mesmo quando os editores optaram por não treinar os produtos de AI do Google, testemunhou um vice-presidente de produto da empresa no tribunal na sexta-feira. Isto porque os controlos do Google para os editores excluírem o treino de AI cobrem o trabalho do Google DeepMind, o laboratório de AI da empresa, disse Eli Collins, vice-presidente do DeepMind. Outras organizações da empresa podem treinar ainda mais os modelos para os seus produtos.
Este tipo de revelação não ajuda nada à já tensa relação entre os criadores de conteúdo e as empresas de AI. É como se os editores dissessem «não use o meu conteúdo» e o Google respondesse «bem, tecnicamente não estamos a usá-lo para ESTA coisa específica, apenas para TUDO o resto». Prevejo mais batalhas legais no horizonte, e o Google pode acabar por se arrepender desta abordagem demasiado esperta.
Google planeia lançar o chatbot de AI Gemini para crianças menores de 13 anos
A gigante tecnológica anunciou que o seu chatbot Gemini estará disponível para crianças na próxima semana e alertou as famílias sobre as alterações por email. O Gemini terá proteções específicas para impedir a produção de conteúdo impróprio e não utilizará os dados das contas Family Link para treinar a sua AI.
Hum, este é um terreno delicado. Por um lado, as crianças já estão a crescer num mundo de AI e precisam de aprender a navegar nele; por outro, sabemos que nenhum filtro de conteúdo é perfeito. O compromisso de não utilizar os dados das crianças para treino é positivo, mas será que os pais realmente confiam na Google para proteger os seus filhos? Espero que estas proteções sejam realmente robustas.
Demis Hassabis anuncia o Gemini 2.5 Pro Preview 'I/O edition' com capacidades de codificação melhoradas
Demis Hassabis anunciou o lançamento do Gemini 2.5 Pro Preview 'I/O edition', destacando as suas capacidades de codificação e posições de liderança na LMArena e WebDev Arena Leaderboard. A ferramenta é especialmente útil para construir aplicações web interativas e prototipagem, com demonstrações disponíveis em @GeminiApp, Vertex Al e Al Studio.
A Google está a apertar o cerco à OpenAI no departamento de desenvolvimento de software. Tem graça como o Gemini começou a focar-se tanto em capacidades de codificação – talvez seja uma reação ao rumor da compra da Windsurf pela OpenAI? De qualquer forma, é muito saudável ver a velocidade a que estes modelos estão a evoluir, e como cada um está a encontrar os seus pontos fortes.
Criar e editar imagens com o Gemini 2.0 em pré-visualização
A Google anunciou que as capacidades de Geração de Imagens estão agora disponíveis em pré-visualização com o Gemini 2.0 Flash, permitindo aos developers integrar a geração e edição de imagens conversacionais com limites de taxa mais elevados através da API Gemini no Google AI Studio e Vertex AI. O modelo foi aprimorado com melhor qualidade visual, renderização de texto mais precisa e taxas de bloqueio de filtro significativamente reduzidas. As funcionalidades incluem recontextualizar produtos em novos ambientes, edição colaborativa de imagens em tempo real, edição de partes específicas de imagens conversacionalmente e criação dinâmica de novos SKUs de produtos com renderização de texto e imagem.
Estamos finalmente a ver o Google a usar a sua experiência em visão computacional na nova era da AI generativa. A renderização de texto na imagem tem sido o calcanhar de Aquiles de muitos modelos, por isso é surpreendente que o Gemini tenha melhorado nesta área. Para os developers, estas novas APIs podem ser um verdadeiro game-changer em termos de criação de experiências visuais dinâmicas. Entretanto a Europa ainda vai levar algum tempo para testar esta funcionalidade, eu só consegui fazer meus testes usando uma VPN...
Google lança ferramentas de AI para proteger utilizadores do Chrome contra fraudes
O Google anunciou o lançamento de novas defesas alimentadas por inteligência artificial (AI) para ajudar a combater fraudes no Chrome. A gigante tecnológica começará a usar o Gemini Nano, o seu modelo de linguagem grande (LLM) no dispositivo, no desktop para proteger os utilizadores contra fraudes online. Também está a lançar novos avisos alimentados por AI para o Chrome no Android para ajudar os utilizadores a estarem cientes de notificações de spam.
Esta é possivelmente uma das aplicações mais práticas e necessárias da AI que vimos ultimamente. Com o aumento exponencial de fraudes online, ter um sistema inteligente a filtrar e identificar tentativas de phishing é ouro. O uso do Gemini Nano é especialmente inteligente, pois processa tudo localmente – um bom equilíbrio entre eficácia e privacidade. Talvez eu finalmente possa convencer a minha avó a usar a internet sem medo.
Ligar o GitHub à pesquisa aprofundada do ChatGPT
A pesquisa aprofundada agora pode aceder aos teus repositórios do GitHub. O conector de pesquisa aprofundada do GitHub está disponível globalmente para utilizadores Team e para utilizadores Plus e Pro, exceto na EEE, Suíça e Reino Unido. O acesso para utilizadores empresariais será anunciado numa data posterior.
Esta integração vai fazer maravilhas para a produtividade dos programadores. Imaginem poder perguntar ao ChatGPT sobre um bug específico no vosso código sem ter de copiar e colar dezenas de ficheiros? A exclusão dos países da UE, Suíça e Reino Unido é um lembrete dos desafios regulatórios que a AI enfrenta. Um ponto para o RGPD em termos de proteção de dados, mas um ponto perdido em termos de acesso a ferramentas inovadoras.
OpenAI chega a acordo para comprar a startup Windsurf por 3 mil milhões de dólares
A OpenAI concordou em adquirir a Windsurf, uma ferramenta de programação assistida por inteligência artificial anteriormente conhecida como Codeium, por cerca de 3 mil milhões de dólares, marcando a maior aquisição do criador do ChatGPT até o momento. O negócio ainda não foi concluído e ambas as empresas declinaram comentar.
«Concordou em adquirir» parece até piada, como se alguém estivesse a obrigar a OpenAI a comprar alguma coisa. 3 mil milhões por uma empresa de assistência à programação? A OpenAI está claramente a apostar forte no segmento de desenvolvimento de software. A ferramenta da Windsurf (anteriormente Codeium) sempre foi excelente e com recursos da OpenAI, pode tornar-se um flop total, já que a força do Windsurf vem da integração com o Claude e o Gemini, enquento que o GPT nunca foi bom em codificação. Imagino que a GitHub Copilot esteja a sentir a pressão agora. Quanto a mim, com certeza vou abandonar o Windsurf...
OpenAl expande a liderança com Fidji Simo
A OpenAl anunciou a nomeação de Fidji Simo como CEO de Aplicações, reportando diretamente ao CEO da OpenAl, Sam. Simo irá concentrar-se em permitir que as funções «tradicionais» da empresa se expandam à medida que entram numa nova fase de crescimento. Sam manterá o cargo de CEO da OpenAI e supervisionará o sucesso em todas as áreas, incluindo Pesquisa, Computação e Aplicações.
A contratação de Fidji Simo é um movimento estratégico brilhante pela OpenAI. Tendo liderado o Facebook App e sendo presidente da Instacart, ela traz uma experiência incrível em produtos de consumo. Parece-me que a OpenAI está a preparar-se para uma expansão massiva dos seus produtos orientados para o consumidor. O ChatGPT pode ter sido apenas a ponta do icebergue, com certeza estão de olho na expansão do Google.
A Evolução da Estrutura da OpenAI
O Conselho da OpenAI anunciou um plano atualizado para a evolução da sua estrutura, mantendo o controlo sem fins lucrativos e transicionando a sua LLC com fins lucrativos para uma Public Benefit Corporation (PBC). Esta mudança visa equilibrar os interesses dos acionistas e a missão da empresa, garantindo que a AGI beneficie toda a humanidade. A OpenAI pretende democratizar a AI, colocando ferramentas incríveis nas mãos de todos e equilibrando a segurança com a inovação.
A estrutura híbrida da OpenAI sempre foi fascinante – e frequentemente confusa. Esta transição para PBC faz sentido, permitindo-lhes manter o foco no bem público enquanto continuam a operar como uma empresa que precisa de gerar lucro para sobreviver e inovar. É um equilíbrio delicado, e será intrigante ver como os investidores reagem a esta mudança. No final do dia, espero que isto realmente ajude a manter a AI segura e benéfica para todos. Falta só trazer de volta o ideal de ser «open»...
Expansão do que perdemos com a bajulação
A OpenAI publicou um artigo onde detalha uma atualização do GPT-4o no ChatGPT que o tornou mais bajulador. A atualização tinha como objetivo agradar ao utilizador, validando dúvidas, alimentando a raiva, incitando ações impulsivas ou reforçando emoções negativas. A OpenAI reconheceu que a atualização foi um erro e partilhou os seus planos para melhorar o processo de revisão do modelo.
Adoro a suposta transparência da OpenAI neste caso. Ver uma empresa tecnológica admitir «ups, cometemos um erro» em vez de tentar encobrir as coisas, como fez no passado com o vazamento de milhoes de dados dos utilizadotres. A bajulação pode parecer inofensiva, mas um modelo que apenas diz o que queremos ouvir tem pouca utilidade e até pode ser prejudicial em determinados contextos. Esperemos que esta lição leve a um processo de revisão mais rigoroso no futuro e que sejam verdadeiramente mais transparentes.
Paper: ZeroSearch - Incentivar a capacidade de pesquisa de LLMs sem pesquisa
O artigo apresenta o ZeroSearch, um método de aprendizagem por reforço que melhora as capacidades de pesquisa de LLMs sem interagir diretamente com motores de pesquisa reais, simulando a interação através de LLMs ajustados para gerar documentos relevantes e ruidosos, e utiliza uma estratégia de rollout curricular para aumentar progressivamente a dificuldade dos cenários de pesquisa.
Isto é absolutamente brilhante! Imaginem só: treinar modelos para pesquisar sem precisar de motores de busca reais. É como ensinar alguém a conduzir num simulador antes de pôr as mãos num carro verdadeiro. A eficiência de recursos aqui é extraordinária, e tenho a certeza que esta abordagem vai abrir caminho para LLMs muito mais capazes e autónomos no futuro próximo.
Paper: Zero absoluto - raciocínio de autorreprodução reforçado com dados zero
O artigo apresenta o «Absolute Zero Reasoner» (AZR), um novo paradigma de aprendizagem por reforço com recompensas verificáveis (RLVR) que visa melhorar as capacidades de raciocínio de modelos de linguagem, aprendendo diretamente com recompensas baseadas em resultados, sem supervisão humana ou dados externos. O AZR evolui o seu currículo de treino e capacidade de raciocínio usando um executor de código para validar tarefas de raciocínio de código e verificar respostas, atuando como uma fonte unificada de recompensa verificável para orientar a aprendizagem.
É engraçado como estamos a conseguir cada vez mais ensinar modelos a «pensar por si próprios». O conceito de um modelo que aprende sem input humano é quase como ver uma criança a descobrir o mundo sozinha – só que neste caso, a uma velocidade exponencial. Este tipo de avanço pode ser o que nos leva a uma AI verdadeiramente autónoma nas próximas iterações.
E é tudo por esta semana, amigos! Que semana intensa no mundo da tecnologia, não é? Desde avanços na forma como treinamos modelos de AI até às grandes manobras estratégicas das gigantes tecnológicas, ficou claro que estamos num período de aceleração e transformação sem precedentes.
O mais interessantes foram os desenvolvimentos na Apple, que parece estar finalmente a abraçar a revolução da AI, e as mudanças estruturais na OpenAI, que continuam a definir como a AI será desenvolvida e implementada. Enquanto isso, a corrida entre Google e OpenAI continua a aquecer, com ambas as empresas a lançarem novos recursos a um ritmo vertiginoso.
Até à próxima semana, continuem curiosos e mantenham-se atualizados! O comboio da tecnologia não para – e nós também não.