Em comparação com Nano Banana Pro, Alibaba e ByteDance lançam modelos de geração de imagens no mesmo dia. A IA para imagens reais irá alcançar uma aplicação em larga escala no mercado?

robot
Geração de resumo em curso

Corrida entre China e EUA na IA, competição acirrada.

Em 10 de fevereiro, Alibaba e ByteDance lançaram, no mesmo dia, novos modelos de geração de imagens, ambos alinhados ao Nano Banana Pro do Google.

Dentre eles, o Qwen-Image-2.0 da Alibaba foca na compreensão semântica e edição prática, com arquitetura unificada de geração e edição, reforçando a capacidade de renderização de caracteres chineses, podendo entender melhor comandos longos e complexos; enquanto o Seedream5.0 Preview da ByteDance destaca-se na busca por imagens geradas e controle refinado, com melhoria significativa na compreensão de prompts, suporte a geração de texturas mais detalhadas e ajustes controlados, adaptando-se profundamente ao fluxo completo de criação de conteúdo.

Em 11 de fevereiro, um operador de capacidade computacional revelou ao jornal Daily Economic News que atualmente a IA tem diversas aplicações no cenário de comércio eletrônico, sendo uma delas o consumo de tokens (a menor unidade de texto) por avatares digitais, e outra, a geração de imagens por IA para e-commerce. O arquiteto de soluções avançadas do modelo Qwen, Xiong Hantian, afirmou em entrevista que a atualização do Qwen-Image-2.0 também foi otimizada para detalhes de produção de produtos, controle de texto e edição secundária, voltada para o cenário de e-commerce.

Vale destacar que a geração de imagens por IA já não se limita à criação visual, avançando para aplicações em escala empresarial. Até 2025, a tecnologia de geração de imagens deve se infiltrar no comércio eletrônico e no mercado de séries de animação, e com o avanço da tecnologia, será que em 2026 surgirá um mercado de aplicações em larga escala?

Alinhado ao Nano Banana Pro, a evolução do modelo de IA de geração de imagens nacional

Em 10 de fevereiro, Alibaba e ByteDance lançaram seus modelos de geração de imagens. A Alibaba lançou o novo modelo de geração e edição de imagens Qwen-Image-2.0, enquanto a ByteDance disponibilizou o Seedream5.0 Preview nas plataformas Jianying e Xiaoyunque, sua plataforma de criação de IA, ambos alinhados ao Nano Banana Pro do Google.

Segundo a Alibaba, o Qwen-Image-2.0 suporta entrada de texto com até 1K tokens e resolução de 2K, podendo renderizar comandos complexos com precisão, gerando facilmente apresentações profissionais e infográficos. Além disso, o Qwen-Image-2.0 foi totalmente atualizado com base nos modelos Qwen-Image e Qwen-Image-Edit, unificando geração e edição de imagens em um único modelo, com uma arquitetura mais leve, elevando significativamente o desempenho na geração e modificação de imagens.

Por sua vez, a ByteDance afirmou que o Seedream 5.0 Preview suporta resoluções de 2K e 4K, e atualmente os usuários podem experimentar gratuitamente a saída em 2K na plataforma Jiyun.

Um executivo sênior de P&D de uma empresa listada comentou que anteriormente também usavam tecnologia de geração de imagens por IA para criar PPTs e imagens de produtos empresariais, mas ainda há problemas com detalhes textuais e consistência visual.

Wu Chenfei, responsável pela geração visual do Qwen na Alibaba, explicou que a falha na detalhamento textual na geração de imagens por IA ocorre por duas razões principais. Primeiro, a maioria dos modelos atuais usa tecnologia VAE (autoencoder variacional), cuja reconstrução afeta significativamente o processamento de textos na imagem, especialmente textos pequenos. Isso ocorre porque o VAE é uma técnica de compressão, e quando há muitos textos na imagem, a dificuldade de geração aumenta, limitada pela capacidade do VAE. Segundo, a capacidade de modelagem do próprio modelo de geração de imagens limita sua qualidade, pois a capacidade do VAE define o limite do modelo, e essa capacidade impacta diretamente a realismo e o detalhamento das imagens geradas.

Quanto falta para a IA de geração de imagens atingir aplicações empresariais?

Atualmente, com a evolução dos modelos de geração de imagens por IA, sua aplicação no comércio eletrônico e no mercado de séries de animação tem recebido atenção, com o conceito de IA para séries de animação crescendo no mercado de capitais.

Em 11 de fevereiro, Zhang Yi, CEO e analista-chefe da iiMedia Research, afirmou que a produção de séries de animação por IA atualmente se baseia principalmente na geração de imagens por IA, que são transformadas em vídeos, complementados por dublagem e legendas, formando o método padrão do setor.

A Eastmoney Securities destacou em relatório que a IA pode reduzir em até 90% os custos de produção de séries de animação. Zhou Liqiang, gerente geral do departamento de animação por IA da China Digital, afirmou anteriormente que a IA simplificou os 11 processos complexos tradicionais de produção de séries de animação para quatro etapas: roteiro, geração de imagens, conversão de imagens em vídeo e pós-produção, aumentando bastante a velocidade de produção.

Um dos principais problemas é que as séries de animação por IA dependem fortemente do modo de geração por “sorteio de cartas” (prompting). A maior limitação dessa abordagem é que o resultado final depende quase totalmente da compreensão e raciocínio da IA, enquanto o artista que ajusta os prompts é o único que pode melhorar o resultado.

Dados da iMedia Research mostram que a maioria dos usuários valoriza a IA por reduzir custos de produção (51,2%) e acelerar a transformação de IPs (47,7%). Além disso, quase metade dos usuários apontou que há deficiências na uniformidade do estilo visual (47,1%) e na expressividade emocional da dublagem (46,7%).

Zhang Yi acredita que o mercado de séries de animação por IA está passando por um crescimento explosivo. A tecnologia de IA traz oportunidades e desafios ao setor, ao mesmo tempo que impulsiona a eficiência e a evolução do conteúdo, por meio da redução de custos e aceleração da transformação de IPs, também força o setor a melhorar a criatividade e a qualidade, diante de problemas como uniformidade de estilo, qualidade da dublagem e desenvolvimento de personagens.

Fora das séries de animação, outro mercado que está sendo silenciosamente transformado pela IA de geração de imagens é o cenário de comércio eletrônico.

No comércio eletrônico, há uma grande demanda por uso de imagens. Em 11 de fevereiro, um operador de capacidade computacional revelou que a geração de imagens por IA é uma das principais demandas dos clientes de e-commerce, além de avatares digitais, consumindo muitos tokens.

Xiong Hantian afirmou que o cenário de e-commerce é uma das principais aplicações do modelo Qwen-Image, e a atualização para Qwen-Image-2.0 foi baseada nesse cenário, com melhorias e otimizações que podem impulsionar a adoção em escala empresarial.

Por exemplo, no cenário de e-commerce, a descrição de páginas de produtos e fotos de modelos usando roupas pode ser melhorada com o novo modelo de geração de imagens. Em comparação com a geração anterior, que exigia edição secundária para controle, a nova versão integra tarefas de edição e geração em um único modelo, aumentando a eficiência dos vendedores.

(Origem: Daily Economic News)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar

Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)