對標Nano Banana Pro 阿里、字節同一天發布圖像生成模型 AI生圖將迎來規模化應用市場?

robot
摘要生成中

中美AI競速,角逐正酣。

2月10日,阿里和字節同一天發布了新圖像生成模型,兩家大廠均對標谷歌Nano Banana Pro。

其中,阿里Qwen-Image-2.0聚焦語義理解與實用編輯,統一生成與編輯架構,強化中文漢字渲染能力,可更好地理解超長、複雜的實用化指令;字節Seedream5.0 Preview則主打檢索生圖與精細調控,顯著提升提示詞理解準確率,支持更細緻的紋理生成與可控調整,深度適配內容創作全流程。

2月11日,有算力運營商向《每日經濟新聞》記者透露,目前AI在電商場景中有不少應用,一類是數字人對token(最小文本單元)的消耗量比較明顯,另一類是電商AI生圖的消耗。千問大模型高級解決方案架構師熊撼天在接受採訪時表示,此次更新的Qwen-Image-2.0模型,也基於電商場景在商品生產細節和文字可控度、二次編輯等方面進行優化。

值得注意的是,當前AI生圖已經不局限於視覺創作,更進一步走向企業級、規模化應用的賽道中。2025年圖像生成技術逐步滲透到電商場景、漫劇市場中,隨著AI生圖技術進步,2026年能迎來規模化應用市場嗎?

對標Nano Banana Pro,國產AI生圖模型再進化

2月10日,阿里和字節都發布了圖像生成模型。阿里千問發布新一代圖像生成及編輯模型Qwen-Image-2.0,字節跳動旗下剪映、字節AI創作平台小雲雀等平台上線圖像生成模型Seedream5.0 Preview,兩款模型都對標谷歌Nano Banana Pro。

据阿里千問方面介紹,Qwen-Image-2.0支持1K token的超長文字輸入和2K高分辨率,可準確渲染複雜指令,輕鬆生成專業的PPT及資訊圖。同時,Qwen-Image-2.0在Qwen-Image和Qwen-Image-Edit兩大模型基礎上全新升級,首次將圖像生成和編輯統一到一個模型中,以更輕量的模型架構,實現了生圖和改圖性能的大幅提升。

而字節方面則表示,Seedream 5.0 Preview的圖像支持2K和4K分辨率輸出,目前用戶可以在即夢平台免費體驗2K輸出效果。

有上市公司資深研發高管表示,此前也經常用AI生圖技術製作PPT和企業產品圖,但文字細節和圖片的一致性等問題,仍存在一些瑕疵。

千問Qwen視覺生成負責人吳晨飛表示,AI生圖文字細節崩潰主要是兩方面原因。其一,當前圖像生成模型普遍採用VAE(變分自動編碼器)技術,而VAE的重構過程對圖像中文字的處理影響顯著,特別是小尺寸文字。這是由於VAE本質上是一種壓縮機制,當圖像中文字內容較多時,生成難度將顯著提升,且受限於VAE的處理能力上限。其二,受限於圖像生成模型的建模能力。VAE決定了模型的能力上限,而生成模型的建模能力則直接影響圖像生成的真實度與細節還原質量。

AI生圖離企業級應用還有多遠?

目前,隨著AI生圖模型迭代,其在電商和漫劇市場的應用備受關注,資本市場上AI漫劇概念持續升溫。

2月11日,艾媒諮詢CEO兼首席分析師張毅表示,目前AI漫劇製作,主流途徑是AI生成圖片,由圖片視頻化,再搭配AI配音、字幕,來完成出片,這是目前行業比較標準的形態。

東吳證券就在研報中指出,AI可以使漫劇製作成本降低90%。中文在線AI動漫部總經理周立強此前曾表示,AI把傳統漫劇的11個繁複製作流程,精簡為劇本創作、圖片生成、圖轉視頻、後期加工4個步驟,大大提高生產速度。

而問題的症結之一是AI漫劇極為依賴抽卡生成模式。這一模式最大的问题在於,最終的生成效果幾乎完全取決於AI自身的理解、推理能力,抽卡師唯一能做的只有打磨提示詞。

iMedia Research(艾媒諮詢)數據顯示,多數用戶肯定AI技術在降低製作成本(51.2%)與加快IP轉化(47.7%)方面的價值。同時,近半數用戶亦指出其在畫面風格統一性(47.1%)與配音情感表現(46.7%)上存在明顯不足。

張毅認為,當前AI漫劇市場迎來爆發式增長。AI技術對漫劇行業的影響兼具機遇與挑戰,既通過降低製作成本、加快IP轉化等推動行業生產效率與內容形態升級,也因畫風統一度、配音質感及角色塑造等質量問題,倒逼行業在追求規模化的同時強化內容創意與品質把控。

AI漫劇之外,AI生圖正在悄然改變的另一大市場是電商場景。

電商購物場景中存在大量圖片使用需求。2月11日,有算力運營商向記者透露,AI生圖是當前除數字人外,電商客戶消耗token比較大的一个需求。

熊撼天表示,電商場景是千問Qwen-Image模型落地的主流場景之一,此次更新的Qwen-Image-2.0也基於電商場景應用,在此前模型基礎上進行了升級和優化,有望推動企業級應用落地。

以電商場景為例,熊撼天表示,商品詳情頁描述圖、模特穿搭效果,可以更好地結合新的圖像生成模型完成。相較於上一代圖像生成模型需要通過二次編輯等完成可控的商品出圖,新模型迭代將圖片編輯和生成任務融合在一個模型中實現,從而實現電商賣家的效率提升。

(資料來源:每日經濟新聞)

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)