CEO da NVIDIA 黄仁勋publica artigo assinado mais recente: O "bolo de cinco camadas" da IA

robot
Geração de resumo em curso

A IA é uma das forças poderosas que moldam o mundo atual. Não é apenas uma aplicação inteligente, nem um único modelo, mas uma infraestrutura essencial, tal como a eletricidade e a internet.

A IA depende de hardware real, energia e sistemas económicos para funcionar. Pode transformar matérias-primas em inteligência em grande escala. Cada empresa irá aplicar IA, e cada país ou região irá desenvolver IA.

Para entender por que a IA evolui desta forma, é necessário raciocinar a partir dos princípios básicos e compreender as mudanças fundamentais que ocorreram na área da computação.

De software pré-fabricado a inteligência em tempo real

Na história do desenvolvimento tecnológico, o software era geralmente pré-construído. Os humanos descreviam um algoritmo, e o computador executava-o. Os dados tinham que ser cuidadosamente projetados, armazenados em tabelas e recuperados através de consultas precisas. SQL tornou-se indispensável, pois o mundo antigo funcionava assim.

A IA rompeu esse padrão.

Agora temos uma máquina capaz de entender informações não estruturadas. Ela consegue reconhecer imagens, ler textos, ouvir sons e compreender seus significados. Pode raciocinar com base no contexto e na intenção. O mais importante é que consegue gerar inteligência em tempo real.

Cada resposta é criada do zero. Cada resposta depende do contexto fornecido. Não se trata de uma instrução armazenada, mas de uma inferência e geração de inteligência conforme a necessidade.

Como a inteligência é gerada em tempo real, toda a arquitetura computacional por trás precisa ser redesenhada.

IA como infraestrutura

Do ponto de vista industrial, a arquitetura da IA pode ser dividida em cinco camadas.

Energia

A camada mais baixa é a energia. A inteligência gerada em tempo real precisa de energia elétrica que também seja gerada em tempo real. Cada token produzido resulta do fluxo de elétrons, da gestão de calor e da conversão de energia em cálculo. Não há camadas de abstração nesta camada. A energia é o princípio fundamental da infraestrutura de IA e o fator limitador da quantidade de inteligência que o sistema pode produzir.

Chips

Acima da energia estão os chips. Estes processadores convertem energia em capacidade de cálculo de forma eficiente e em grande escala. As cargas de trabalho de IA requerem processamento paralelo massivo, memória de alta largura de banda e conexões rápidas. O avanço nesta camada determina a velocidade de expansão da IA e a aplicabilidade da inteligência.

Infraestrutura

Sobre os chips está a camada de infraestrutura. Inclui terrenos, fornecimento de energia, sistemas de refrigeração, construção, comunicação de rede e sistemas que coordenam milhares de processadores numa única máquina. Estas são as fábricas de IA. O objetivo não é armazenar informações, mas produzir inteligência.

Modelos

Acima da infraestrutura está a camada de modelos. Os modelos de IA podem compreender diversos tipos de informação: linguagem, biologia, química, física, finanças, medicina e o próprio mundo físico. Os modelos de linguagem são apenas uma categoria. Trabalhos revolucionários estão ocorrendo em áreas como IA de proteínas, IA química, simulações físicas, robótica e sistemas autônomos.

Aplicações

No topo está a camada de aplicações, onde o valor económico é criado, como plataformas de desenvolvimento de medicamentos, robôs industriais, assistentes jurídicos, veículos autônomos, etc. Os veículos autônomos representam uma aplicação concreta de IA. Os robôs humanoides são uma manifestação física da IA. A mesma arquitetura pode gerar resultados diferentes.

Esta é a arquitetura de cinco camadas:

Energia → Chips → Infraestrutura → Modelos → Aplicações.

Cada aplicação bem-sucedida impulsiona todas as camadas abaixo dela, até a fonte de energia que as sustenta.

Estamos apenas começando este processo de construção, já investimos trilhões de dólares, mas ainda é necessário construir infraestruturas no valor de dezenas de trilhões.

Globalmente, vemos fábricas de chips, montadoras de computadores e fábricas de IA sendo construídas em uma escala sem precedentes. Está se tornando a maior infraestrutura da história da humanidade.

O esforço de mão de obra necessário é enorme. Fábricas de IA precisam de eletricistas, encanadores, soldadores, trabalhadores de aço, técnicos de rede, instaladores e operadores. São empregos altamente especializados, bem remunerados, e atualmente escassos. Participar nesta transformação não exige um doutoramento em ciência da computação.

Ao mesmo tempo, a IA está aumentando a produtividade de toda a economia do conhecimento. Como exemplo, na radiologia, a IA já ajuda na interpretação de imagens, mas a demanda por radiologistas continua crescendo. Isso não é contraditório.

A função do radiologista é cuidar do paciente, e interpretar imagens é apenas uma parte do seu trabalho. Quando a IA assume tarefas rotineiras, os radiologistas podem focar na avaliação, comunicação e cuidado. A eficiência dos hospitais aumenta, podendo atender mais pacientes e contratar mais profissionais.

O aumento de produtividade gera capacidade de produção, e essa expansão impulsiona o crescimento.

Mudanças no último ano?

No último ano, a IA ultrapassou uma barreira importante. O desempenho dos modelos melhorou significativamente, podendo ser utilizados em larga escala. A capacidade de raciocínio aumentou, as alucinações diminuíram, e a implementação prática avançou bastante. Aplicações baseadas em IA começaram a gerar valor económico real.

Setores como desenvolvimento de medicamentos, logística, atendimento ao cliente, software e manufatura já demonstram forte alinhamento com o mercado. Essas aplicações impulsionam todas as camadas da arquitetura.

Modelos de código aberto desempenham papel crucial. A maioria dos modelos globais é gratuita e aberta. Pesquisadores, startups, empresas e até países usam modelos abertos para participar do avanço da IA. Quando esses modelos atingem o estado de ponta, eles mudam não só o software, mas ativam toda a cadeia tecnológica.

DeepSeek-R1 é um exemplo. Ao disponibilizar amplamente modelos de raciocínio poderosos, acelera a adoção na camada de aplicações e aumenta a demanda por treinamento, infraestrutura, chips e energia.

A essência da questão

Quando você vê a IA como uma infraestrutura indispensável, seu impacto fica claro.

A IA começou com grandes modelos de linguagem Transformer, mas seu significado vai muito além. Trata-se de uma revolução industrial que está remodelando a produção e o consumo de energia, a construção de fábricas, a organização do trabalho e o caminho do crescimento económico.

Hoje, fábricas de IA estão sendo construídas porque a inteligência é gerada em tempo real. Chips estão sendo redesenhados, pois a eficiência determina a velocidade de expansão da inteligência. A energia tornou-se elemento central, pois fundamentalmente limita a escala de produção de inteligência. As aplicações aceleram seu desenvolvimento, pois os modelos de base já ultrapassaram o limiar, podendo ser utilizados em larga escala.

Cada camada reforça a outra.

Por isso, a escala da construção de IA é tão grande, podendo atingir múltiplos setores e não se limitar a um único país, região ou área. Cada empresa usará IA, cada país desenvolverá IA.

Estamos ainda na fase inicial. A maior parte da infraestrutura ainda não foi construída, a maior parte da força de trabalho ainda não foi treinada, e a maior parte das oportunidades ainda não foi explorada.

Mas o caminho já está claro.

A IA está se tornando a infraestrutura do mundo moderno. E nossas escolhas, a velocidade de construção, a abrangência da participação e a forma responsável de implementá-la determinarão o rumo desta era.

O NVIDIA GTC acontecerá de 16 a 19 de março de 2026, na Califórnia, em São José, e também online. Junte-se a nós para explorar as possibilidades ilimitadas da próxima geração de IA.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar