A Nvidia revelou o Groq 3, uma nova unidade de processamento de linguagem projetada especificamente para inferência de IA, durante a conferência Nvidia GTC em San Jose. Isso marca um avanço significativo no desenvolvimento da tecnologia de IA, já que a inferência agora pode lidar com solicitações de usuários com menor latência.

Groq 3: Uma nova era para a inferência de IA
A nova LPU Groq 3 foi desenvolvida com tecnologia da start-up Groq, que a Nvidia adquiriu por 20 bilhões de dólares. Esta unidade é otimizada para processamento rápido de dados, algo crucial para aplicações de IA que exigem respostas imediatas.
O desenvolvimento do Groq 3 destaca a importância de chips especializados para inferência de IA, um campo que tem experimentado crescimento significativo. O foco da Nvidia em baixa latência e processamento eficiente de dados pode revolucionar a forma como modelos de IA são usados em grande escala.
Fonte: spectrum.ieee.org
Leia também: xAI processada após Grok gerar CSAM