O novo modelo DeepSeek chegou?

robot
Geração de resumo em curso

DeepSeek está a avançar com o teste de versão em fase de gradação do novo modelo, ou seja, a versão final de gradação antes do lançamento oficial do V4.

Em 11 de fevereiro, alguns utilizadores ao abrir o DeepSeek App receberam uma notificação de atualização de versão. Após a atualização do APP (1.7.4), os utilizadores podem experimentar o mais recente modelo do DeepSeek. Com esta atualização, o comprimento do contexto do modelo será expandido de 128K para 1M, quase um aumento de 10 vezes; a base de conhecimento foi atualizada até maio de 2025, e várias capacidades centrais receberam melhorias substanciais.

O autor testou e constatou que, na resposta às perguntas, o DeepSeek atualmente provavelmente não é o V4, mas sim a forma final evoluída da série V3, ou a versão de gradação final antes do lançamento oficial do V4.

A Nomura Securities publicou um relatório a 10 de fevereiro, afirmando que, espera-se que o modelo DeepSeek V4, lançado em meados de fevereiro de 2026, não cause o mesmo pânico global de procura de capacidade de computação de IA que foi desencadeado pelo lançamento do V3 no ano passado. A instituição acredita que, o valor central do V4 reside na inovação na arquitetura subjacente para impulsionar a comercialização de aplicações de IA, e não na revolução da cadeia de valor de IA existente.

De acordo com avaliações, a nova versão já igualou a capacidade de processamento de tarefas complexas de modelos principais de código fechado como Gemini 3 Pro e K2.5. A Nomura acrescenta que o V4 deverá introduzir duas inovações tecnológicas, mHC e Engram, que irão superar os limites de chips de computação e memória a nível de algoritmo e engenharia. Testes internos preliminares mostram que o V4 já supera modelos contemporâneos como Anthropic Claude e a série GPT da OpenAI em tarefas de programação.

A importância desta publicação reside em reduzir ainda mais os custos de treino e inferência, oferecendo uma via viável para aliviar a pressão de capital de empresas globais de modelos de linguagem de grande escala e aplicações de IA.

Arquitetura inovadora otimizada para limitações de hardware

O relatório da Nomura destaca que o desempenho dos chips de computação e as limitações de memória HBM continuam a ser restrições intransponíveis para a indústria de grandes modelos nacionais. O DeepSeek V4, que será lançado em breve, introduz as arquiteturas mHC (superconexão e restrição de manifolds) e Engram, que são otimizadas a nível de sistema para abordar essas limitações em duas dimensões: treino e inferência.

mHC

  • Sigla de “Superconexão de restrição de manifolds”. Destina-se a resolver os problemas de gargalo na circulação de informação e instabilidade no treino de modelos Transformer com profundidade extrema.

  • Simplificando, permite uma comunicação mais rica e flexível entre as camadas da rede neural, ao mesmo tempo que aplica restrições matemáticas rigorosas para evitar amplificação ou destruição de informações. Experimentos demonstraram que modelos com mHC apresentam melhor desempenho em tarefas de raciocínio matemático.

Engram

  • Um módulo de “memória condicional”. A sua conceção visa desacoplar “memória” de “cálculo”.

  • O conhecimento estático do modelo (como entidades ou expressões fixas) é armazenado numa tabela de memória esparsa, que pode ser colocada em DRAM de baixo custo. Quando necessário, a tabela é rapidamente consultada para inferência. Isto liberta a memória GPU cara (HBM), permitindo que ela se concentre no cálculo dinâmico.

A tecnologia mHC, ao melhorar a estabilidade do treino e a eficiência de convergência, ajuda a mitigar, até certo ponto, a disparidade geracional entre chips nacionais em largura de banda de interconexão e densidade de cálculo; enquanto a arquitetura Engram visa reestruturar o mecanismo de gestão de memória, superando as limitações de capacidade e largura de banda da memória de vídeo (VRAM) de forma mais eficiente, mesmo com fornecimento limitado de HBM. A Nomura acredita que, estas duas inovações constituem uma solução de adaptação ao ecossistema de hardware nacional, com valor claro de implementação prática.

O relatório também destaca que, o impacto comercial mais imediato do lançamento do V4 será a redução substancial dos custos de treino e inferência. A otimização de custos estimulará a procura por aplicações downstream, impulsionando um novo ciclo de construção de infraestruturas de IA. Nesse processo, os fabricantes chineses de hardware de IA poderão beneficiar de uma dupla dinâmica de aumento de procura e investimento antecipado.

Mudança no panorama de mercado de “domínio absoluto” para “competição entre várias empresas”

O relatório da Nomura revisitou as mudanças no mercado um ano após o lançamento do DeepSeek V3/R1. No final de 2024, dois modelos do DeepSeek representavam mais da metade do uso de tokens de modelos de código aberto na plataforma OpenRouter.

No entanto, até ao segundo semestre de 2025, com a entrada de mais participantes, a quota de mercado do DeepSeek diminuiu significativamente. O mercado passou de “um único dominador” para uma “competição entre várias empresas”. O ambiente competitivo do V4 é muito mais complexo do que há um ano. A “eficiência de gestão de capacidade de computação” do DeepSeek, combinada com a “melhoria de desempenho”, acelerou o desenvolvimento de grandes modelos de linguagem e aplicações na China, alterando o cenário global e aumentando o interesse por modelos de código aberto.

Oportunidade para empresas de software aumentarem valor

A Nomura acredita que, os principais provedores globais de serviços em nuvem estão a perseguir intensamente a inteligência artificial geral, e a corrida por investimento de capital ainda não terminou, portanto, o V4 provavelmente não causará um impacto de grande escala no mercado de infraestruturas de IA como no ano passado.

Por outro lado, os desenvolvedores de grandes modelos e aplicações enfrentam custos de capital cada vez maiores. Se o V4 conseguir manter alto desempenho ao mesmo tempo que reduz significativamente os custos de treino e inferência, ajudará essas empresas a transformar rapidamente a tecnologia em receita, aliviando a pressão de lucros.

Na vertente de aplicações, um V4 mais potente e eficiente impulsionará a criação de agentes de IA mais avançados. A análise da Nomura indica que aplicações como o App Qianwen da Alibaba já conseguem executar tarefas multi-etapa de forma mais automatizada, com agentes de IA a evoluir de “ferramentas de diálogo” para “assistentes de IA” capazes de lidar com tarefas complexas.

Estes agentes multi-tarefa, que interagem com modelos de grande escala com maior frequência, consumirão mais tokens, elevando a procura por capacidade computacional. Assim, a melhoria do desempenho do modelo não “mataria” o software, mas criaria valor para as empresas de software líderes. A Nomura destaca a importância de identificar empresas que possam aproveitar rapidamente as capacidades do novo modelo para criar aplicações ou agentes de IA disruptivos. O potencial de crescimento dessas empresas pode ser elevado por avanços na capacidade do modelo.

Avisos de risco e isenção de responsabilidade

        O mercado apresenta riscos, investir com cautela. Este artigo não constitui aconselhamento de investimento pessoal, nem leva em consideração objetivos, situação financeira ou necessidades específicas de qualquer utilizador. Os utilizadores devem avaliar se as opiniões, pontos de vista ou conclusões aqui apresentadas são compatíveis com a sua situação particular. Investir com base neste conteúdo é de sua responsabilidade.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar

Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)