Puissance de calcul AI : augmentation de 39 000 milliards de tokens, soit 370 fois ! Fournisseurs cloud + AIDC + puissance de calcul

2026-02-12 14:34:29

Aujourd’hui, la puissance de calcul AI : Refroidissement liquide + AIDC + fournisseurs cloud + location de puissance continue de s’intensifier ! [Taogu Ba]

Une fois de plus, cela confirme notre stratégie parfaite : passer fin janvier d’une précision dans l’aérospatiale commerciale à la puissance de calcul !

Et maintenant, avec l’approche du Nouvel An chinois, les géants de l’IA locaux lancent tour à tour de grandes initiatives, ce qui pousse davantage la consommation de puissance de calcul !

Ainsi, l’augmentation simultanée du volume et du prix des tokens est inévitable ; l’inflation de la puissance de calcul se transmettra officiellement au secteur des services cloud (domestiques).

Le parcours actuel de spéculation sur le marché autour de l’IA : GPU – stockage – processus avancés – CPU – services cloud – IDC ;

1. Pénurie grave de puissance de calcul

1. Dream 2.0 — “8 heures d’attente pour générer une vidéo de 15 secondes”

Derrière une attente de 8 heures pour générer une vidéo de 15 secondes se cache la vague de création massive déclenchée par le modèle vidéo AI Seedance 2.0 de ByteDance, grâce à une avancée technologique révolutionnaire. Sa capacité de génération cinématographique augmente directement l’attente des utilisateurs, tout en révélant une pénurie de capacité de calcul à un stade donné.

Phénomène d’attente extrême : La popularité technologique et la pression sur le système — en période de pointe, attente de plus de 8 heures : le 11 février 2026, une mesure réelle montre que, après soumission d’une tâche de génération vidéo, plus de 1000 personnes étaient en file d’attente. Même en payant pour un “pass accéléré”, il faut attendre 8 heures pour générer une vidéo de 15 secondes.
Les utilisateurs ordinaires en période de pointe mettent en moyenne 20-30 minutes (y compris la vérification de sécurité), tandis que les membres premium (abonnement annuel à 5199 RMB) ne prennent que 3-5 minutes.

Cause principale de congestion : insuffisance des ressources en puissance de calcul !

2. Concurrence féroce pour les ressources de puissance de calcul pendant le Nouvel An chinois

Les laboratoires d’IA chinois sont en compétition intense pendant le Nouvel An, lançant de nouveaux modèles et des activités “enveloppe rouge” agressives. Mais derrière cette agitation se cache une réalité plus urgente : la demande de calcul augmente rapidement, exerçant une pression énorme sur tout l’écosystème.

Selon une enquête sectorielle, la tension sur les ressources est réelle. Une grande entreprise internet chinoise a été contrainte de suspendre la plupart de ses nouveaux projets, réaffectant ses ressources limitées pour répondre à la demande soudaine liée aux campagnes marketing du Nouvel An.

Au cours des dernières semaines, une ruée pour acheter des ressources de calcul, notamment des puces Nvidia, a eu lieu pour faire face à la croissance explosive de l’utilisation de l’IA. Les géants louent la puissance à des prix deux fois plus élevés que le marché. Lorsqu’ils en ont l’occasion, ils achètent même directement des puces, en contournant la location, sans se soucier du prix.

Cette lutte annonce une augmentation encore plus forte de la demande de puissance de calcul cette année. Prenons l’exemple de la vague de génération vidéo Seedance 2.0 — la puissance, la mémoire et l’infrastructure requises sont stupéfiantes.

Le raisonnement est simple : IA plus performante → utilisation plus folle → explosion des tokens → demande de puissance / cloud / puces en forte hausse !

2. Augmentation simultanée du volume et du prix des tokens

Les tokens sont l’“unité de facturation + unité de consommation” pour les grands modèles d’IA.

On peut les comprendre comme : “flux / électricité / nombre de caractères” consommés par l’IA pour effectuer un travail, et le coût dépend de la quantité utilisée.

Pendant le Nouvel An, le nombre de personnes utilisant Seedance pour générer des vidéos sera très élevé, ce qui entraînera une explosion du volume de tokens. Seedance continuera probablement à itérer vers des versions plus haute définition. La consommation de tokens liée à la dépense de 26 ans en tokens par ByteDance est énorme, et un objectif de 10 fois plus est inévitable.

JPMorgan prévoit qu’entre 2025 et 2030, la consommation de tokens pour l’inférence IA en Chine connaîtra un taux de croissance annuel composé d’environ 330 %, passant de 10 000 milliards de tokens en 2025 à 390 000 milliards en 2030, soit une croissance de 370 fois.

Avec l’explosion actuelle des agents + multimodalité + contenu long, la hausse simultanée du volume et du prix des tokens est inévitable (voir le graphique ci-dessous de Google Gemini). L’inflation de la puissance de calcul se transmettra en continu aux niveaux inférieurs, et elle est désormais officiellement transmise au secteur des services cloud domestiques.

1. Augmentation du volume de tokens

La demande en tokens pour les agents dans les scénarios d’agent unique explose de façon exponentielle : la consommation de tokens d’un seul agent est dix fois celle d’un chatbot ; la collaboration entre plusieurs agents consomme deux fois plus de tokens qu’un chatbot. En 2026, des agents à haute valeur (Claude Code, Cowork, Openclaw, etc.) seront déployés rapidement, et les modèles open source (GLM-5, Kimi K2.5) dépasseront la “limite d’utilisabilité”, amorçant une application à grande échelle.
La nouvelle génération de grands modèles mondiaux étend généralement la fenêtre de contexte de quelques dizaines de milliers à 100w, permettant de traiter un livre entier ou une grande base de code en une seule requête, ce qui augmente considérablement la consommation de tokens.
Les agents multimodaux doivent encoder des images, audio et autres informations non textuelles en tokens visuels : une image haute résolution peut être encodée en plusieurs milliers de tokens, ce qui augmente encore la consommation totale.

2. Hausse du prix des tokens :

La hausse continue du coût des ressources en puissance de calcul en amont + la demande rigide en aval font que les modèles de premier plan (OAI + 40 %, Anthropic, Zhipu + 30 %) commencent à augmenter leurs prix de token, mettant fin à l’ère des tokens à bas prix.
La commercialisation des agents à haute valeur pousse le prix des tokens de “frais d’utilisation logiciel” à “rémunération des employés numériques”. Sur le marché, on voit déjà des services d’agents à haute valeur (Harvey AI, version entreprise) avec une consommation mensuelle de 500 dollars par personne, et des prix de 1000-2000 dollars par mois, ce qui augmente considérablement la valeur des tokens.
L’inflation de la puissance de calcul se transmet en continu aux niveaux inférieurs : GPU – stockage – processus avancés – CPU – services cloud – IDC
La capacité de production des processus avancés de puces, la pénurie de matériel pour les centres de données (transformateurs, systèmes de refroidissement, etc.), ainsi que les limitations énergétiques et infrastructurelles, font que les coûts matériels en amont continuent d’augmenter.
En janvier 2026, AWS et Google Cloud ont déjà augmenté leurs prix, avec une hausse de 15 % à 100 % pour les services liés à l’IA et aux GPU, mettant fin à la période de baisse des prix du cloud.
L’inflation s’est désormais officiellement propagée aux services cloud domestiques : le 5 février, Wangsu a augmenté ses prix CDN et stockage de 30-40 %, et le 11 février, UCloud a augmenté tous ses prix. D’autres fournisseurs cloud pourraient suivre.

3. Hausse des prix des services cloud

Cloudflare a publié ses résultats, avec une hausse de 15 % après clôture, et prévoit que ses ventes pour 2026 et le premier trimestre dépasseront les prévisions de Wall Street, grâce au développement rapide des applications d’IA, ce qui entraîne une augmentation de la demande en calcul. L’inflation de la puissance de calcul se transmet officiellement au secteur des services cloud domestiques !

Les bonnes nouvelles concernant le cloud se multiplient récemment :

En février 2026, plusieurs entreprises ont annoncé une augmentation des prix de leurs services cloud ;
La SAS (Société d’État) : les entreprises publiques doivent augmenter activement leurs investissements dans la puissance de calcul ;
La Commission d’État pour la gestion des actifs publics : se concentrer sur la rupture des technologies clés, poursuivre la recherche sur les “grands modèles” ;
Li Qiang : promouvoir pleinement l’innovation technologique en IA, le développement industriel et l’application de l’IA.

Le secteur des services cloud pourrait connaître une période de hausse généralisée en 2026 :

Le 24 janvier, Amazon AWS a annoncé une augmentation d’environ 15 % du prix de ses services EC2 pour la formation de grands modèles, rompant la tradition de “baisse continue des prix” de près de 20 ans ;

Le 27 janvier, Google Cloud a annoncé qu’à partir de mai 2026, il augmenterait officiellement ses prix pour les services de transmission de données mondiaux, avec une hausse d’environ 100 % dans la région Nord-Américaine.

L’annonce de cette hausse par UCloud en Chine reflète que :

l’entreprise anticipe une inflexion dans le secteur des services cloud ;
les coûts en matériel, énergie, etc. augmentent rigidement, et l’entreprise répercute ces coûts, ce qui témoigne d’une demande continue et forte pour la puissance de calcul en IA.

4. Entreprises clés bénéficiaires

1.××× :

L’entreprise a franchi la transition d’un fabricant traditionnel à un fournisseur de services de pile complète pour la puissance de calcul IA, avec une valeur d’actifs clé :

Opérations IDC : l’entreprise a réussi à finaliser la cession des actifs de Qinhuai Data, avec une gouvernance améliorée. En tant que principal fournisseur IDC de ByteDance (avec une part importante du chiffre d’affaires), Qinhuai Data, avec ses réserves de ressources dans la région de Pékin et ses nœuds clés, bénéficiera directement de la croissance des investissements en puissance de calcul de ByteDance, avec un potentiel de croissance des résultats.

Technologie de refroidissement liquide : l’entreprise a fait un pas concret dans le domaine du refroidissement liquide, en développant ses matériaux en amont + en réalisant des acquisitions, accélérant sa transformation d’un fournisseur de matériaux à un fournisseur de solutions complètes, avec l’espoir d’obtenir une part plus importante dans la chaîne d’approvisionnement des grands acteurs mondiaux.

Composants haut de gamme : face aux défis de miniaturisation des alimentations IA, l’entreprise a construit une nouvelle base de R&D pour supercondensateurs. Cela marque la transition de la technologie de films superposés du laboratoire à une industrialisation à grande échelle, intégrée en profondeur dans les systèmes d’alimentation des centres de données via des solutions sur mesure.

2.×××× :

L’entreprise collabore depuis plusieurs années avec Tencent Cloud pour renforcer la synergie dans le réseau de puissance de calcul. En s’appuyant sur plus de 2800 nœuds périphériques déjà modernisés à l’échelle mondiale, Sunac Technology construit un réseau distribué de puissance de calcul, combiné aux capacités IA complètes de Tencent Cloud, pour créer une architecture d’inférence IA cloud-edge. La campagne de “red envelopes” de Tencent, avec des milliards de RMB en récompenses, attire une multitude d’utilisateurs en interaction simultanée, avec des scénarios de questions-réponses IA en temps réel et de distribution intelligente, générant un pic de demande en puissance de calcul à court terme. Sunac optimise la gestion des ressources en déployant le calcul à proximité des nœuds périphériques, maintenant le délai d’inférence de bout en bout sous 10 ms, garantissant une interaction fluide en haute concurrence et la stabilité du système. Cela en fait un partenaire clé pour soutenir la puissance de calcul dans les scénarios IA de Tencent. Avec la popularisation des applications interactives IA, la demande en puissance de calcul en périphérie continuera de croître, et la collaboration entre les deux parties pourrait s’étendre à davantage de scénarios à haute concurrence et en temps réel, élargissant le potentiel commercial des services de puissance de calcul.

3.×××× :

L’entreprise a confirmé un point d’inflexion dans ses résultats, avec une croissance à deux chiffres alimentée par la puissance de calcul IA et l’écosystème Tencent, annonçant une explosion de ses performances. Selon la prévision de résultats du 27 janvier 2026, l’entreprise prévoit un bénéfice net attribuable aux actionnaires compris entre 270 millions et 330 millions de RMB pour 2025, soit une croissance près de 10 fois par rapport à l’année précédente. La croissance repose principalement sur la mise à l’échelle de la puissance de calcul, avec une augmentation de la capacité IA de 13 000 P au début de l’année à 33 000 P, entièrement loués, avec une forte certitude de réalisation.

Grâce à sa collaboration étroite avec Tencent, l’entreprise bénéficie d’un potentiel de croissance en double moteur : la croissance de l’échelle de la puissance de calcul et la croissance des applications des grands acteurs. Sur le plan manufacturier, la libération de la capacité à l’étranger contribuera à améliorer la marge brute et à soutenir la croissance globale. La valorisation se redéfinit, avec une capitalisation boursière en forte hausse : la prévision de bénéfice net pour 2025 d’environ 300 millions RMB donne un ratio P/E nettement inférieur à la moyenne du secteur IA, offrant un potentiel de réévaluation important. En regardant vers 2026, avec la réalisation des profits liés à la puissance de calcul, la hausse des prix et la synergie avec l’écosystème Tencent, l’entreprise pourrait atteindre de nouveaux sommets. En utilisant une estimation prudente d’un bénéfice net de 500 millions RMB en 2026 et une valorisation raisonnable, la valorisation actuelle est sous-estimée, offrant une grande opportunité de réévaluation historique.

Vous, devant votre écran, reconnaissez-vous le potentiel d’explosion continue du secteur de la puissance de calcul IA ? Où se trouve la valeur ? Où sont les opportunités ?
**
Like + partage + commentaire : La hausse des prix de la puissance de calcul IA continue, quelle entreprise géante a le plus de potentiel d’explosion ?**

TOKEN4,84%

AGENT5,31%

GLM0,99%

AWS0,51%

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.