sábado, 14 de setembro de 2024

Novo desafio da Nvidia




Cerebras Systems revelou sua ferramenta de IA que pode atrapalhar o domínio da Nvidia na computação de IA.

As GPUs Nvidia são ideais para executar grandes modelos de IA como ChatGPT. No entanto, estes modelos muitas vezes requerem centenas de GPUs para trabalharem em conjunto, tornando-os caros e ineficientes, especialmente para empresas mais pequenas.

A Cerebras oferece sua solução: lançar um dos melhores modelos de IA, LLaMA 3.1, como código aberto em seu chip Wafer Scale Engine, um grande wafer de silício de 44 GB SRAM com largura de banda de 21 Pbps. O dispositivo é capaz de gerar mais de 1.800 tokens por segundo ao executar o Llama 3.1 8B com precisão de 16 bits graças ao uso de SRAM.

Elimina a necessidade de múltiplas GPUs.


Oferece desempenho significativamente mais rápido - até 20 vezes em comparação com as ofertas da Nvidia e aumenta a eficiência.

Melhor preço: a Cerebras oferece esse serviço por apenas 10 centavos por milhão de tokens processados.


Os especialistas prevêem que o segmento de mercado de IA crescerá rapidamente, e a Cerebras pretende capturar uma parcela significativa desse mercado, oferecendo uma alternativa econômica e de alto desempenho às soluções existentes baseadas em GPU. À medida que a procura por IA cresce, mais empresas estarão prontas para desafiar os gigantes do mercado e disponibilizar IA avançada a uma gama mais ampla de utilizadores.