Les analystes de l'industrie chez Deloitte prévoient un changement significatif dans l'infrastructure d'IA : les charges de travail d'inférence pourraient représenter environ deux tiers de l'utilisation totale de la puissance de calcul en IA d'ici la fin de 2026. Cette tendance a des implications pour la chaîne d'approvisionnement en semi-conducteurs et l'allocation des ressources informatiques. À mesure que l'inférence devient de plus en plus dominante par rapport à la formation dans les opérations d'IA, les fabricants de matériel spécialisés dans les processeurs à usage général et spécialisé sont positionnés pour bénéficier de la croissance anticipée du calcul. La transition reflète la phase de maturation des systèmes d'IA passant du développement à une déploiement en production à grande échelle.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Les analystes de l'industrie chez Deloitte prévoient un changement significatif dans l'infrastructure d'IA : les charges de travail d'inférence pourraient représenter environ deux tiers de l'utilisation totale de la puissance de calcul en IA d'ici la fin de 2026. Cette tendance a des implications pour la chaîne d'approvisionnement en semi-conducteurs et l'allocation des ressources informatiques. À mesure que l'inférence devient de plus en plus dominante par rapport à la formation dans les opérations d'IA, les fabricants de matériel spécialisés dans les processeurs à usage général et spécialisé sont positionnés pour bénéficier de la croissance anticipée du calcul. La transition reflète la phase de maturation des systèmes d'IA passant du développement à une déploiement en production à grande échelle.