В последнее время весь технологический и инвестиционный мир пристально следит за одним вопросом: как применение ИИ «убивает» традиционный SaaS. После того как @AnthropicAI представила Claude Cowork, показывая, как легко он помогает писать письма, создавать презентации и анализировать Excel-таблицы, началась паника о «смерти программного обеспечения». Это действительно впечатляет, но если вы остановитесь только на этом, то можете упустить настоящий крупный сейсмический сдвиг.
Это похоже на то, как все мы смотрим вверх на воздушные боевые дроны, а при этом не замечаем, что под нашими ногами тихо движется вся континентальная плита. Настоящий шторм скрыт под водой, в уголке, который большинство не замечает: фундамент вычислительной мощности, поддерживающий весь мир ИИ, переживает «тихую революцию».
И эта революция может привести к тому, что продавец ИИ — Nvidia @nvidia — завершит свой грандиозный праздник раньше, чем все ожидали.
Два пересекающихся пути революции
Эта революция — не единичное событие, а сплетение двух, казалось бы, независимых технологических линий. Они словно две наступающие армии, образующие клин, — и создают давление на гегемонию GPU Nvidia.
Первая — революция в оптимизации алгоритмов.
Задумывались ли вы, действительно ли суперразуму нужно задействовать все нейроны при решении задач? Очевидно, нет. DeepSeek понял это и создал архитектуру MoE (смесь экспертов).
Можно представить её как компанию, в которой работают сотни специалистов из разных областей. Но при решении конкретной задачи на совещании вызывают только двух-трех наиболее релевантных экспертов, а не всех сразу. Вот в чем умность MoE: она позволяет огромной модели при каждом вычислении активировать лишь небольшую часть «экспертов», значительно экономя вычислительные ресурсы.
Что получается? Модель DeepSeek-V2, номинально содержащая 236 миллиардов «экспертов» (параметров), при работе активирует всего 21 миллиард, то есть менее 10% от общего числа. А её производительность сопоставима с GPT-4, который работает на 100% мощности. Что это значит? Возможности ИИ и затраты вычислительной мощности разъединены!
Ранее считалось, что чем мощнее ИИ, тем больше он «жрет» видеокарт. Теперь DeepSeek показывает, что благодаря умным алгоритмам можно добиться того же результата за десятые доли стоимости. Это ставит под сомнение необходимость в GPU Nvidia как таковых.
Вторая — революция в аппаратном обеспечении.
Обучение и вывод ИИ — это два этапа. Обучение похоже на учебу: нужно читать тысячи книг, и тут GPU — мощный «чудо-агрегат» для параллельных вычислений. Но вывод — это уже повседневное использование ИИ, где важна скорость реакции.
У GPU при выводе есть изначальный недостаток: его память (HBM) внешняя, и передача данных вызывает задержки. Это как повар, у которого все ингредиенты в холодильнике в соседней комнате — даже при быстрой работе он всё равно тратит время на беготню. А компании Cerebras, Groq и другие создали специальные чипы для вывода, где память (SRAM) прямо припаяна к чипу, и ингредиенты под рукой — доступ без задержек.
Рынок уже голосует за это деньгами. OpenAI жалуется на слабость GPU Nvidia при выводе, а затем заключает контракт на 10 миллиардов долларов с Cerebras для аренды их решений. Nvidia сама в панике — она выкупила за 20 миллиардов долларов компанию Groq, чтобы не отставать в этой новой гонке.
Когда эти два пути пересекаются: ценовой взрыв
Теперь соединим всё: модель DeepSeek, «сделанную тоньше» с помощью алгоритма MoE, и чип Cerebras, обеспечивающий «ноль задержек».
Что произойдет?
Ценовой лавинообразный эффект.
Во-первых, уменьшенная модель занимает очень мало места и полностью помещается в встроенную память чипа. Во-вторых, без внешних задержек отклик ИИ станет поразительно быстрым. Итог: затраты на обучение по архитектуре MoE снизились на 90%, а на вывод — за счет специализированного оборудования и разреженных вычислений — еще в десять раз. В итоге, стоимость создания и эксплуатации мирового уровня ИИ может составлять всего 10–15% от традиционной GPU-схемы.
Это не просто улучшение — это смена парадигмы.
Трон Nvidia медленно сдвигается
Теперь понятно, почему это событие гораздо опаснее «паники вокруг Cowork».
Рынок Nvidia сегодня оценивается в триллионы долларов, основан на простой идее: ИИ — будущее, а его будущее — только благодаря моим GPU. Но сейчас эта основа начинает шататься.
На рынке обучения, даже если Nvidia продолжит доминировать, если клиенты смогут выполнять задачи за десятые доли стоимости карт, общий объем рынка может значительно сократиться.
На рынке вывода, где объем в десять раз больше, чем на обучении, Nvidia не только не имеет абсолютного преимущества, но и сталкивается с конкуренцией со стороны Google, Cerebras и других. Даже её крупнейший клиент — OpenAI — уже «бунтует».
Если Уолл-стрит поймет, что «копалка» Nvidia — не единственный и даже не лучший вариант, то оценка, основанная на ожидании «вечной монополии», может рухнуть. Все это — очень очевидно.
Итак, в ближайшие полгода главным черным лебедем может стать не очередной прорыв в ИИ, а, например, новая статья о эффективности алгоритмов MoE или отчет о росте доли рынка специализированных чипов для вывода — и это тихо объявит о начале новой стадии в гонке за вычислительные мощности.
Когда «продавец лопат» перестает быть единственным выбором, его золотая эпоха, возможно, тоже подходит к концу.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Следующее землетрясение в сфере ИИ: почему настоящая опасность — это не убийца SaaS, а революция вычислительной мощности?
Автор: Брюс
В последнее время весь технологический и инвестиционный мир пристально следит за одним вопросом: как применение ИИ «убивает» традиционный SaaS. После того как @AnthropicAI представила Claude Cowork, показывая, как легко он помогает писать письма, создавать презентации и анализировать Excel-таблицы, началась паника о «смерти программного обеспечения». Это действительно впечатляет, но если вы остановитесь только на этом, то можете упустить настоящий крупный сейсмический сдвиг.
Это похоже на то, как все мы смотрим вверх на воздушные боевые дроны, а при этом не замечаем, что под нашими ногами тихо движется вся континентальная плита. Настоящий шторм скрыт под водой, в уголке, который большинство не замечает: фундамент вычислительной мощности, поддерживающий весь мир ИИ, переживает «тихую революцию».
И эта революция может привести к тому, что продавец ИИ — Nvidia @nvidia — завершит свой грандиозный праздник раньше, чем все ожидали.
Два пересекающихся пути революции
Эта революция — не единичное событие, а сплетение двух, казалось бы, независимых технологических линий. Они словно две наступающие армии, образующие клин, — и создают давление на гегемонию GPU Nvidia.
Первая — революция в оптимизации алгоритмов.
Задумывались ли вы, действительно ли суперразуму нужно задействовать все нейроны при решении задач? Очевидно, нет. DeepSeek понял это и создал архитектуру MoE (смесь экспертов).
Можно представить её как компанию, в которой работают сотни специалистов из разных областей. Но при решении конкретной задачи на совещании вызывают только двух-трех наиболее релевантных экспертов, а не всех сразу. Вот в чем умность MoE: она позволяет огромной модели при каждом вычислении активировать лишь небольшую часть «экспертов», значительно экономя вычислительные ресурсы.
Что получается? Модель DeepSeek-V2, номинально содержащая 236 миллиардов «экспертов» (параметров), при работе активирует всего 21 миллиард, то есть менее 10% от общего числа. А её производительность сопоставима с GPT-4, который работает на 100% мощности. Что это значит? Возможности ИИ и затраты вычислительной мощности разъединены!
Ранее считалось, что чем мощнее ИИ, тем больше он «жрет» видеокарт. Теперь DeepSeek показывает, что благодаря умным алгоритмам можно добиться того же результата за десятые доли стоимости. Это ставит под сомнение необходимость в GPU Nvidia как таковых.
Вторая — революция в аппаратном обеспечении.
Обучение и вывод ИИ — это два этапа. Обучение похоже на учебу: нужно читать тысячи книг, и тут GPU — мощный «чудо-агрегат» для параллельных вычислений. Но вывод — это уже повседневное использование ИИ, где важна скорость реакции.
У GPU при выводе есть изначальный недостаток: его память (HBM) внешняя, и передача данных вызывает задержки. Это как повар, у которого все ингредиенты в холодильнике в соседней комнате — даже при быстрой работе он всё равно тратит время на беготню. А компании Cerebras, Groq и другие создали специальные чипы для вывода, где память (SRAM) прямо припаяна к чипу, и ингредиенты под рукой — доступ без задержек.
Рынок уже голосует за это деньгами. OpenAI жалуется на слабость GPU Nvidia при выводе, а затем заключает контракт на 10 миллиардов долларов с Cerebras для аренды их решений. Nvidia сама в панике — она выкупила за 20 миллиардов долларов компанию Groq, чтобы не отставать в этой новой гонке.
Когда эти два пути пересекаются: ценовой взрыв
Теперь соединим всё: модель DeepSeek, «сделанную тоньше» с помощью алгоритма MoE, и чип Cerebras, обеспечивающий «ноль задержек».
Что произойдет?
Ценовой лавинообразный эффект.
Во-первых, уменьшенная модель занимает очень мало места и полностью помещается в встроенную память чипа. Во-вторых, без внешних задержек отклик ИИ станет поразительно быстрым. Итог: затраты на обучение по архитектуре MoE снизились на 90%, а на вывод — за счет специализированного оборудования и разреженных вычислений — еще в десять раз. В итоге, стоимость создания и эксплуатации мирового уровня ИИ может составлять всего 10–15% от традиционной GPU-схемы.
Это не просто улучшение — это смена парадигмы.
Трон Nvidia медленно сдвигается
Теперь понятно, почему это событие гораздо опаснее «паники вокруг Cowork».
Рынок Nvidia сегодня оценивается в триллионы долларов, основан на простой идее: ИИ — будущее, а его будущее — только благодаря моим GPU. Но сейчас эта основа начинает шататься.
На рынке обучения, даже если Nvidia продолжит доминировать, если клиенты смогут выполнять задачи за десятые доли стоимости карт, общий объем рынка может значительно сократиться.
На рынке вывода, где объем в десять раз больше, чем на обучении, Nvidia не только не имеет абсолютного преимущества, но и сталкивается с конкуренцией со стороны Google, Cerebras и других. Даже её крупнейший клиент — OpenAI — уже «бунтует».
Если Уолл-стрит поймет, что «копалка» Nvidia — не единственный и даже не лучший вариант, то оценка, основанная на ожидании «вечной монополии», может рухнуть. Все это — очень очевидно.
Итак, в ближайшие полгода главным черным лебедем может стать не очередной прорыв в ИИ, а, например, новая статья о эффективности алгоритмов MoE или отчет о росте доли рынка специализированных чипов для вывода — и это тихо объявит о начале новой стадии в гонке за вычислительные мощности.
Когда «продавец лопат» перестает быть единственным выбором, его золотая эпоха, возможно, тоже подходит к концу.