Mais de 150 parceiros em todas as camadas do ecossistema de Inteligência Artificial incorporando microsserviços de inferência do NIM para acelerar as implantações de aplicações de IA empresariais de semanas para minutos
- Membros do Programa de Desenvolvedores da NVIDIA obtêm acesso gratuito ao NIM para pesquisa, desenvolvimento e testes
COMPUTEX – A NVIDIA anuncia que os 28 milhões de desenvolvedores do mundo todo já podem baixar o NVIDIA NIM™ – microsserviços de inferência que fornecem modelos como contêineres otimizados – para ser implantado em nuvens, data centers ou estações de trabalho, proporcionando a capacidade de criar facilmente aplicações de IA generativa para copilots, chatbots e muito mais, em minutos em vez de semanas.
Essas novas aplicações de IA generativa estão se tornando cada vez mais complexas e frequentemente utilizam vários modelos com diferentes recursos para gerar texto, imagens, vídeo, fala e muito mais. O NVIDIA NIM aumenta drasticamente a produtividade do desenvolvedor ao fornecer uma maneira simples e padronizada de adicionar IA generativa a suas aplicações.
O NIM também permite que as empresas maximizem seus investimentos em infraestrutura. Por exemplo, a execução do Meta Llama 3-8B em um NIM produz até três vezes mais tokens de IA generativa em uma infraestrutura acelerada do que sem o NIM. Isso permite que as empresas aumentem a eficiência e usem a mesma quantidade de infraestrutura de computação para gerar mais respostas.
Aproximadamente 200 parceiros de tecnologia – incluindo a Cadence, Cloudera, Cohesity, DataStax, NetApp, Scale AI e Synopsys – estão integrando o NIM em suas plataformas para acelerar as implementações de IA generativa para aplicações específicas de domínio, como copilots, assistentes de código e avatares humanos digitais. Hugging Face está oferecendo o NIM – começando pelo Meta Llama 3.
“Todas as empresas estão buscando adicionar IA generativa às suas operações, mas nem todas as empresas têm uma equipe dedicada de pesquisadores de IA”, afirma Jensen Huang, fundador e CEO da NVIDIA. “Integrado a plataformas em todos os lugares, acessível a desenvolvedores em todos os lugares e em execução em todos os lugares – o NVIDIA NIM está ajudando o setor de tecnologia a colocar a IA generativa ao alcance de todas as organizações”.
As empresas podem implantar aplicações de IA em produção com o NIM por meio da plataforma de software NVIDIA AI Enterprise. A partir do próximo mês, os membros do Programa de Desenvolvedores NVIDIA podem acessar o NIM gratuitamente para pesquisa, desenvolvimento e testes em sua infraestrutura preferida.
Mais de 40 microsserviços NIM potencializam modelos de IA generativa em todas as modalidades
Os contêineres NIM são pré-construídos para acelerar a implantação de modelos para inferência acelerada por GPU e podem incluir software NVIDIA CUDA®, NVIDIA Triton Inference Server™ e NVIDIA TensorRT™-LLM.
Mais de 40 modelos da NVIDIA e da comunidade estão disponíveis para serem experimentados como terminais NIM em ai.nvidia.com, incluindo Databricks DBRX, o modelo de código aberto Gemma do Google, Meta Llama 3, Microsoft Phi-3, Mistral Large, Mixtral 8x22B e Snowflake Arctic.
Os desenvolvedores agora podem acessar os microsserviços NVIDIA NIM para os modelos Meta Llama 3 a partir da plataforma de IA Hugging Face. Isso permite que os desenvolvedores acessem e executem facilmente o Llama 3 NIM com apenas alguns cliques, usando os terminais de inferência Hugging Face com GPUs NVIDIA na nuvem de sua preferência.
As empresas podem usar o NIM para executar aplicações de geração de texto, imagens e vídeo, fala e humanos digitais. Com os microsserviços NVIDIA BioNeMo™ NIM para a biologia digital, os pesquisadores podem criar novas estruturas de proteínas para acelerar a descoberta de medicamentos.
Dezenas de empresas do setor de saúde estão implementando o NIM para potencializar a inferência de IA generativa em uma série de aplicações, incluindo planejamento cirúrgico, assistentes digitais, descoberta de medicamentos e otimização de ensaios clínicos.
Com os novos microsserviços NVIDIA ACE NIM, os desenvolvedores podem criar e operar facilmente seres humanos digitais interativos e realistas em aplicações para atendimento ao cliente, telessaúde, educação, jogos e entretenimento.
“Com essas novas aplicações de IA generativa, diversos parceiros poderão incorporar esses microsserviços de inferência do NIM para otimizar suas estações de trabalho de forma mais efetiva. Isso possibilitará um avanço significativo no setor de saúde, na indústria, entre outras áreas que estão utilizando essas soluções tecnológicas”, enfatiza Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.
Centenas de parceiros do ecossistema de IA incorporando o NIM
Os fornecedores de plataformas, incluindo Canonical, Red Hat, Nutanix e VMware (adquirida pela Broadcom) estão dando suporte ao NIM em KServe de código aberto ou soluções empresariais. As empresas de aplicação de IA Hippocratic AI, Glean Kinetica e Redis também estão implementando o NIM para alimentar a inferência de IA generativa.
As principais ferramentas de IA e parceiros MLOps – incluindo Amazon SageMaker, Microsoft Azure AI, Dataiku, DataRobot, deepset, Domino Data Lab, LangChain, Llama Index, Replicate, Run.ai, Saturn Cloud, Securiti AI e Weights & Biases – também incorporaram o NIM em suas plataformas para permitir que os desenvolvedores criem e implementem aplicações de IA generativa específicos de um domínio com inferência otimizada.
Integradores de sistemas globais e parceiros de prestação de serviços Accenture, Deloitte, Infosys, Latentview, Quantiphi, SoftServe, TCS e Wipro criaram competências do NIM para ajudar as empresas do mundo todo a desenvolver e implantar rapidamente estratégias de IA de produção.
As empresas podem executar aplicações habilitadas para NIM em praticamente qualquer lugar, inclusive em NVIDIA-Certified Systems™ dos fabricantes globais de infraestrutura Cisco, Dell Technologies, Hewlett-Packard Enterprise, Lenovo e Supermicro, bem como fabricantes de servidores ASRock Rack, ASUS, GIGABYTE, Ingrasys, Inventec, Pegatron, QCT, Wistron e Wiwynn. Os microsserviços do NIM também foram integrados ao Amazon Web Services, Google Cloud, Azure e Oracle Cloud Infrastructure.
Titãs do setor ampliam a IA generativa com o NIM
Os líderes do setor Foxconn, Pegatron, Amdocs, Lowe’s, ServiceNow e Siemens estão entre as empresas que usam o NIM para aplicações de IA generativa em manufatura, saúde, serviços financeiros, varejo, atendimento ao cliente e muito mais:
- Foxconn – a maior fabricante de produtos eletrônicos do mundo – está usando o NIM no desenvolvimento de LLMs específicos de domínio incorporados a uma variedade de sistemas e processos internos em suas fábricas de IA para manufatura inteligente, cidades inteligentes e veículos elétricos inteligentes.
- Pegatron – uma empresa taiwanesa de fabricação de produtos eletrônicos – está aproveitando o NIM para o Project TaME, um modelo da Taiwan Mixtral of Experts criado para promover o desenvolvimento de LLMs locais para os setores.
- Amdocs – um dos principais fornecedores globais de software e serviços para empresas de comunicação e mídia – está usando NIM para executar um LLM de faturamento do cliente que reduz significativamente o custo dos tokens, melhora a precisão em até 30% e reduz a latência em 80%, gerando respostas quase em tempo real.
- Lowe’s – uma empresa de melhorias domésticas da FORTUNE® 50 – está usando IA generativa para uma variedade de casos de uso. Por exemplo, o varejista está aproveitando os microsserviços de inferência NVIDIA NIM para elevar as experiências de funcionários e clientes.
- ServiceNow – a plataforma de IA para transformação de negócios – anunciou no início deste ano que foi um dos primeiros provedores de plataforma a acessar o NIM para permitir o desenvolvimento e a implantação de LLMs rápidos, escaláveis e mais econômicos para seus clientes. Os microsserviços NIM são integrados ao modelo multimodal do Now AI e estão disponíveis para os clientes que têm a experiência de IA generativa da ServiceNow Now Assist instalada.
- Siemens – uma empresa global de tecnologia com foco em indústria, infraestrutura, transporte e saúde – está integrando sua tecnologia operacional com microsserviços NIM para cargas de trabalho de IA no chão de fábrica. Ela também está criando uma versão local de seu Copilot industrial para operadores de máquinas usando NIM.
Disponibilidade
Os desenvolvedores podem experimentar os microsserviços da NVIDIA em ai.nvidia.com gratuitamente. As empresas podem implantar microsserviços NIM de nível de produção com o NVIDIA AI Enterprise executado em NVIDIA-Certified Systems e nas principais plataformas de nuvem. A partir do próximo mês, os membros do Programa de Desenvolvedores NVIDIA terão acesso gratuito ao NIM para pesquisas e testes.
Assista à apresentação da Huang na COMPUTEX para saber mais sobre o NVIDIA NIM.
Sobre a NVIDIA
Desde sua fundação em 1993, a NVIDIA (NASDAQ: NVDA) tem sido pioneira em computação acelerada. A invenção da GPU pela empresa em 1999 estimulou o crescimento do mercado de games para PC, redefiniu a computação gráfica, iniciou a era da IA moderna e tem ajudado a digitalização industrial em todos os mercados. A NVIDIA agora é uma empresa de infraestrutura de computação full-stack com soluções em escala de data center que estão revolucionando o setor. Mais informações em: https://www.nvidia.com/pt-br/.
Acesse também:
Facebook: @NVIDIABrasil
Twitter: @NVIDIABrasil
YouTube: NVIDIA Latinoamérica
Instagram: @NVIDIABrasil
Certas declarações contidas neste comunicado à imprensa, incluindo mas não se limitando a declarações sobre: os benefícios, o impacto, o desempenho, os recursos e a disponibilidade dos produtos e das tecnologias da NVIDIA, incluindo NVIDIA NIM, NVIDIA CUDA, NVIDIA Triton Inference Server, software NVIDIA TensorRT-LLM, programa NVIDIA Developer, NVIDIA BioNeMo, NVIDIA-Certified Systems e NVIDIA AI Enterprise; nossas colaborações e parcerias com terceiros e os benefícios e impactos delas; terceiros usando ou adotando nossos produtos ou tecnologias; todas as empresas buscando adicionar IA generativa às suas operações; e o NVIDIA NIM ajudando o setor de tecnologia a colocar a IA generativa ao alcance de todas as organizações são declarações prospectivas que estão sujeitas a riscos e incertezas que podem fazer com que os resultados sejam materialmente diferentes das expectativas. Os fatores importantes que podem fazer com que os resultados reais sejam materialmente diferentes incluem: condições econômicas globais; a confiança da NVIDIA em terceiros para manufaturar, montar, empacotar e testar produtos NVIDIA; o impacto do desenvolvimento tecnológico e da concorrência; o desenvolvimento de novos produtos e tecnologias NVIDIA ou melhorias nos já existentes; a aceitação de produtos NVIDIA ou de produtos de parceiros NVIDIA no mercado; defeitos de software, projeto ou manufatura; mudanças nas preferências ou nas demandas do consumidor; mudanças nas interfaces e nos padrões do setor; perda inesperada de desempenho de produtos ou tecnologias NVIDIA quando integrados a sistemas; e outros fatores detalhados regularmente nos relatórios mais atuais apresentados pela NVIDIA à Comissão de Valores Mobiliários e Câmbio (SEC – Securities and Exchange Commission), incluindo mas não limitados ao seu relatório anual no Formulário 10-K e aos relatórios trimestrais no Formulário 10-Q. As cópias dos relatórios apresentados à SEC são publicadas no site da empresa e estão disponíveis na NVIDIA gratuitamente. Essas declarações prospectivas não são garantias de desempenho futuro e são baseadas em fatos até esta data, e, salvo por determinação legal, a NVIDIA isenta-se de qualquer obrigação de atualizar tais declarações para refletirem circunstâncias ou eventos futuros.
© 2024 NVIDIA Corporation. Todos os direitos reservados. NVIDIA, o logotipo NVIDIA, BioNeMo, CUDA, NVIDIA NIM, NVIDIA Triton Inference Server e TensorRT são marcas comerciais e/ou marcas registradas da NVIDIA Corporation nos EUA e em outros países. Outros nomes de empresas e produtos podem ser marcas comerciais das respectivas empresas com as quais estão associadas. Os recursos, preços, disponibilidade e especificações estão sujeitos a alterações sem aviso.