IA generativa mais leve e rápida com menos memória
Com o crescimento acelerado da inteligência artificial generativa, modelos como o Stable Diffusion 3.5 Grande têm exigido até 18 GB de VRAM, o que limita a execução em muitos sistemas. Para resolver isso, a NVIDIA aplicou quantização FP8 ao modelo em colaboração com a Stability AI, reduzindo o consumo de memória em 40%, permitindo rodar o modelo com apenas 11 GB de VRAM.
Além disso, com a integração do NVIDIA TensorRT, o desempenho do modelo praticamente dobrou. Na prática, isso significa que usuários com placas GeForce RTX Série 40 e 50 poderão gerar imagens com IA de forma mais rápida e eficiente, até 2,3 vezes mais rápido que métodos anteriores.
Novas otimizações com o TensorRT para RTX
![]() |
Nvidia/Divulgação |
Apresentado durante o Microsoft Build, o TensorRT para RTX agora está disponível como SDK independente para desenvolvedores. Antes, era necessário gerar engines específicas para cada GPU. Agora, com o novo sistema just-in-time (JIT), essas engines são otimizadas diretamente no dispositivo em segundos, simplificando o processo de desenvolvimento e instalação.
O SDK também é compatível com o novo framework Windows ML, que será a base de inferência de IA no Windows, oferecendo integração direta com o sistema operacional.
Microsserviços com Stable Diffusion 3.5
A NVIDIA e a Stability AI também anunciaram que vão lançar o Stable Diffusion 3.5 como um microsserviço NIM, com previsão de chegada em julho. A novidade vai facilitar ainda mais o uso de IA generativa por criadores e desenvolvedores, com APIs acessíveis e maior desempenho integrado.
Mais jogos com DLSS a caminho
Além das novidades em IA, a NVIDIA confirmou novos títulos que receberão suporte à tecnologia DLSS (Deep Learning Super Sampling), que utiliza IA para melhorar o desempenho gráfico sem perda significativa de qualidade. Os destaques ficam por conta de:
-
THRONE AND LIBERTY
-
Until Dawn Remake
Esses jogos se somam à crescente biblioteca de títulos compatíveis com DLSS, que continua sendo uma das tecnologias mais valorizadas por gamers que buscam fluidez e qualidade gráfica em resoluções mais altas.
Postar um comentário