Capacidad de IA: ¡3900 billones de tokens, un aumento de 370 veces! Proveedores de la nube + AIDC + capacidad de cálculo

Hoy, la potencia de cálculo de IA: Enfriamiento líquido + AIDC + proveedores de la nube + alquiler de potencia de cálculo continúa explotando! [Taogu Ba]

Una vez más, se ha confirmado nuestra estrategia perfecta de cambiar de precisión en la exploración espacial comercial a la potencia de cálculo a finales de enero!

Y ahora, con la proximidad del Año Nuevo Lunar, los gigantes de IA nacionales lanzan grandes movimientos, elevando aún más el consumo de potencia de cálculo!

Por lo tanto, la subida simultánea del volumen y el precio de los tokens es inevitable, y la inflación de la potencia de cálculo se transmitirá oficialmente a la etapa de servicios en la nube (domésticos).

El camino de la especulación en el mercado sobre IA actualmente: GPU–almacenamiento–procesos avanzados–CPU—servicios en la nube–IDC;

1. Escasez grave de potencia de cálculo

1. Dream 2.0—“Esperar 8 horas en fila para generar un video de 15 segundos”

Detrás de esperar 8 horas para generar un video de 15 segundos está la tendencia de creación masiva impulsada por la ruptura tecnológica del modelo de video IA Seedance 2.0 de ByteDance, cuyo nivel de generación cinematográfica eleva directamente las expectativas de los usuarios y también revela los cuellos de botella temporales en la oferta de potencia de cálculo actual.

Fenómeno extremo de filas: La explosión de tecnología y la presión del sistema - espera superior a 8 horas en picos: una prueba en febrero de 2026 mostró que, tras enviar una tarea de generación de video, más de 1000 personas estaban en fila; incluso con la opción de “acelerar”, aún se necesitaban 8 horas para generar un video de 15 segundos. Los usuarios normales en picos suelen tardar entre 20-30 minutos (incluyendo revisión de seguridad), mientras que los miembros premium (cuota anual de 5199 yuanes) solo necesitan 3-5 minutos.

Causa principal del congestionamiento: insuficiencia de recursos de potencia de cálculo!

2. La competencia por recursos de potencia de cálculo entre los gigantes de IA en China durante el Año Nuevo Lunar

Durante el Año Nuevo Lunar, los laboratorios de IA en China compiten ferozmente, lanzando nuevos modelos y actividades agresivas de “sobres” (red envelopes). Pero detrás del bullicio hay una historia aún más apremiante: el aumento explosivo en la demanda de cálculo está poniendo una enorme presión en todo el ecosistema.

Según investigaciones del sector, la escasez de recursos es real. Una importante empresa de internet en China se vio obligada a detener la mayoría de sus nuevos planes de negocio, redistribuyendo recursos limitados para soportar el repentino aumento en la demanda por campañas de marketing de Año Nuevo.

En las últimas semanas, ha habido una ola de compras de recursos de cálculo, especialmente chips de Nvidia, para hacer frente al aumento en el uso de IA. Los gigantes alquilan potencia a precios el doble del mercado, e incluso compran chips directamente sin pasar por el proceso de alquiler, sin importar el precio.

Esta competencia indica que la demanda de potencia de cálculo aumentará aún más este año. Solo para soportar la ola de generación de videos con Seedance 2.0, los requisitos de potencia, memoria e infraestructura son asombrosos.

Por lo tanto, la lógica actual es simple: IA más útil → uso más intenso → aumento de tokens → demanda explosiva de potencia de cálculo / nube / chips!

2. Incremento simultáneo en volumen y precio de los tokens

Los tokens son la “unidad de facturación + consumo” de los grandes modelos de IA.

Se pueden entender como: “flujo / electricidad / palabras” consumidas por la IA para hacer su trabajo, cuanto más se use, más cuesta.

Durante el Año Nuevo Lunar, seguramente habrá muchos usuarios generando videos con Seedance, lo que provocará un aumento explosivo en la cantidad de tokens. Seedance seguramente seguirá iterando versiones de mayor resolución, y el consumo de tokens en 2026 será enorme, dado que el consumo de tokens en ByteDance en 2026 será inmenso, y el objetivo de 10 veces más es inevitable.

JPMorgan predice: entre 2025 y 2030, el consumo de tokens en inferencia de IA en China tendrá una tasa de crecimiento anual compuesta de aproximadamente 330%, pasando de 100 mil millones de tokens en 2025 a 3900 mil millones en 2030, un crecimiento de 370 veces.

Con la explosión actual de agentes + multimodalidad + contexto extendido, el aumento simultáneo en volumen y precio de los tokens es inevitable (ver imagen de Google Gemini abajo), y la inflación de potencia de cálculo continúa transmitiéndose a los niveles inferiores, actualmente llegando a los servicios en la nube domésticos.

1. Incremento en volumen de tokens

  1. La demanda de tokens en escenarios de agentes muestra un crecimiento exponencial: el consumo de tokens de un solo agente simple es una magnitud mayor que la de un chatbot; en colaboración multi-agente, el consumo es dos veces mayor. Los agentes de alto valor en 2026 (como Claude Code, Cowork, Openclaw) acelerarán su implementación, y los modelos de código abierto (GLM-5, Kimi K2.5) superarán los “límites de disponibilidad”, comenzando a escalar en aplicaciones masivas.

  2. La ventana de contexto de los nuevos grandes modelos globales se expande de decenas de miles a 100w, permitiendo procesar libros completos o grandes bases de código en una sola solicitud, aumentando drásticamente el consumo de tokens.

  3. Los agentes multimodales necesitan codificar información no textual como imágenes y audio en tokens visuales: una sola imagen de alta resolución puede codificarse en miles de tokens, elevando aún más el consumo total de tokens.

2. Incremento en el precio de los tokens:

  1. Los costos de hardware en la parte superior siguen subiendo, y la demanda rígida en la parte inferior hace que los modelos principales (OAI + 40%, Anthropic, Zhipu + 30%) comiencen a subir los precios de los tokens, terminando con la era de tokens baratos.

  2. La comercialización de agentes de alto valor impulsa la fijación de precios de tokens desde “tarifa de uso de software” hacia “salario de empleados digitales”. Ya existen servicios de agentes de alto valor con consumo mensual de 500 dólares por persona y precios de 1000-2000 dólares al mes (como Harvey AI Legal Agent para empresas), elevando significativamente el valor de los tokens.

  3. La inflación de potencia de cálculo continúa transmitiéndose a los niveles inferiores: GPU–almacenamiento–procesos avanzados–CPU—servicios en la nube–IDC

  4. La capacidad de producción de procesos avanzados y chips, la escasez de hardware en centros de datos (transformadores grandes, sistemas de enfriamiento), y las limitaciones energéticas e de infraestructura, mantienen los costos en alza.

  5. En enero de 2026, AWS y Google Cloud aumentaron precios en servicios relacionados con IA y GPU entre un 15% y un 100%, poniendo fin a la tendencia de bajada de precios en la nube.

  6. La inflación ya se ha transmitido oficialmente a los servicios en la nube domésticos: el 5 de febrero, Wangsu aumentó los precios de CDN y almacenamiento en un 30-40%; el 11 de febrero, UCloud subió los precios de toda su línea de productos. Es probable que más proveedores sigan esta tendencia.

3. Aumento en los precios de los servicios en la nube

Cloudflare reportó resultados, con un aumento del 15% en las ganancias tras la apertura del mercado, y predice que en 2026 las ventas anuales y del primer trimestre superarán las expectativas de Wall Street, impulsadas por el rápido desarrollo de aplicaciones de IA, transmitiendo la inflación de potencia de cálculo a los servicios en la nube domésticos.

Recientemente, las buenas noticias sobre la computación en la nube no dejan de aparecer:

  1. En febrero de 2026, varias empresas anunciaron aumentos en los precios de sus servicios en la nube;

  2. La Comisión de Administración y Supervisión de Activos Estatales (SASAC) de China: las empresas estatales deben ampliar activamente la inversión efectiva en potencia de cálculo;

  3. El Consejo de Estado de China: centrarse en superar tecnologías clave, y continuar investigando en “modelos grandes”;

  4. Li Qiang: promover integralmente la innovación tecnológica en IA, el desarrollo industrial y la habilitación de aplicaciones.

Es probable que en 2026 los servicios en la nube experimenten un ciclo de aumento generalizado:

El 24 de enero, Amazon AWS anunció un aumento de aproximadamente el 15% en su servicio EC2 para entrenamiento de grandes modelos, rompiendo la tradición de casi 20 años de “solo bajadas de precios”;

El 27 de enero, Google Cloud anunció que, a partir de mayo de 2026, aumentará los precios de los servicios de transmisión de datos globales, duplicando las tarifas en Norteamérica respecto a los niveles actuales.

La respuesta de las empresas chinas, como UCloud, a estos aumentos refleja:

  1. La visión de la empresa sobre el futuro del sector de servicios en la nube y la percepción de un punto de inflexión;
  2. El aumento rígido en costos de hardware y energía, que lleva a las empresas a trasladar estos costos, reflejando una demanda sostenida y alta de potencia de cálculo en IA.

4. Empresas clave beneficiadas

1.×××:

La compañía ha completado la transición de fabricante tradicional a proveedor de servicios de pila completa de IA, con activos clave destacados:

Operaciones de IDC: La compañía ha completado con éxito la transferencia de activos de Qinhuai Data, y ha optimizado su estructura de gestión. Como proveedor principal de IDC para ByteDance (con alta proporción de ingresos), Qinhuai Data, con recursos en el área de Beijing y nodos clave, se beneficiará directamente del aumento en el gasto de capital en potencia de cálculo de ByteDance, con potencial de crecimiento en resultados.

Tecnología de enfriamiento líquido: La empresa ha dado pasos sustanciales en enfriamiento líquido, mediante I+D de materiales upstream y fusiones y adquisiciones, acelerando su transformación de proveedor de materiales a proveedor de soluciones integrales, con la expectativa de obtener mayores cuotas en la cadena de suministro de grandes fabricantes globales.

Componentes de alta gama: Para abordar los problemas de miniaturización en fuentes de alimentación de IA, la compañía ha establecido una nueva base de I+D y producción de supercondensadores. Esto marca la transición de la tecnología de láminas apiladas desde laboratorio a producción en masa, integrándose profundamente en los sistemas de alimentación de centros de datos mediante soluciones personalizadas.

2.××××:

La empresa ha profundizado en la colaboración con Tencent Cloud en redes de potencia de cálculo, apoyándose en más de 2800 nodos de borde ya actualizados a potencia de cálculo en todo el mundo. Con la capacidad de IA de Tencent Cloud, ha construido una red de potencia de cálculo distribuida, que, combinada con la capacidad de IA de pila completa de Tencent, crea una arquitectura de inferencia de IA en la nube y en el borde. La campaña de “Red Envelopes de 1,000 millones” de Tencent Yuanbao genera una gran cantidad de interacción de usuarios, preguntas en tiempo real y distribución inteligente, creando picos de demanda de potencia de cálculo en corto plazo, y exigiendo respuestas de baja latencia y alta elasticidad. Wangsu Technology, mediante la gestión cercana de recursos en nodos de borde, mantiene la latencia de inferencia en menos de 10 ms, garantizando una interacción fluida y estable en escenarios de alta concurrencia, y siendo un socio clave en el soporte de potencia de cálculo para escenarios de IA de Tencent. Con la popularización de aplicaciones de interacción IA, la demanda de potencia en el borde seguirá creciendo, y la colaboración entre ambas empresas puede expandirse a más escenarios de alta concurrencia y tiempo real, abriendo nuevas oportunidades de comercialización de servicios de potencia.

3.××××:

La empresa ha establecido un punto de inflexión en resultados, con IA y el ecosistema de Tencent formando un doble motor de crecimiento, logrando un repunte en resultados.

Según el último pronóstico de resultados del 27 de enero de 2026, la compañía estima que la utilidad neta atribuible a los accionistas en 2025 será de entre 270 y 330 millones de yuanes, casi 10 veces más que el año anterior. La principal fuerza impulsora es la escalada de la escala de la potencia de cálculo, con recursos de IA que pasaron de 13,000P a 33,000P en un año, con una ocupación del 100%, asegurando una alta probabilidad de cumplimiento de resultados.

Gracias a su profunda integración con Tencent, la compañía no solo puede seguir duplicando su escala de potencia de cálculo, sino también beneficiarse de la explosión en aplicaciones de grandes fabricantes. En el lado de la fabricación, la liberación de capacidad en el extranjero también mejorará los márgenes, impulsando un crecimiento integral en resultados. La valoración se reconfigura, y el valor de mercado puede crecer: las estimaciones actuales para 2025 proyectan una utilidad neta de aproximadamente 300 millones de yuanes, con un PER mucho menor que el promedio del sector de IA de potencia de cálculo, dejando un gran espacio para revalorizarse. De cara a 2026, con la realización de beneficios de la potencia de cálculo, la subida de precios y la sinergia con el ecosistema de Tencent, se espera que los resultados de la empresa alcancen un nuevo nivel. Basándose en una utilidad neta conservadora de 500 millones en 2026 y en una valoración razonable, la valoración actual está infravalorada, y la empresa tiene un amplio potencial de crecimiento, presentando una oportunidad histórica para una reevaluación de valor.

¿Tú, frente a la pantalla, reconoces la explosión continua del sector de potencia de cálculo de IA? ¿Dónde está el valor? ¿Dónde están las oportunidades?
**
Dale me gusta, comparte y deja un comentario: La subida de precios de la potencia de cálculo de IA continúa, ¿qué gigante tiene más potencial de explosión?**

TOKEN-7,87%
AGENT-1,41%
GLM3,69%
AWS1,3%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado

Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)