Menyasar Nano Banana Pro, Alibaba dan ByteDance merilis model generasi gambar pada hari yang sama. Apakah AI gambar asli akan memasuki pasar aplikasi berskala besar?

robot
Pembuatan abstrak sedang berlangsung

Pertarungan AI antara China dan AS sedang berlangsung dengan sengit.

Pada 10 Februari, Alibaba dan ByteDance merilis model generasi gambar baru pada hari yang sama, keduanya menargetkan setara dengan Google Nano Banana Pro.

Di antaranya, Qwen-Image-2.0 dari Alibaba fokus pada pemahaman semantik dan pengeditan praktis, dengan arsitektur yang menyatukan generasi dan pengeditan, memperkuat kemampuan rendering karakter Tionghoa, sehingga dapat lebih baik memahami instruksi panjang dan kompleks yang bersifat praktis; Seedream5.0 Preview dari ByteDance menonjolkan pencarian gambar langsung dan pengaturan yang halus, secara signifikan meningkatkan akurasi pemahaman kata kunci, mendukung generasi tekstur yang lebih detail dan penyesuaian yang dapat dikendalikan, serta sangat cocok untuk seluruh proses penciptaan konten.

Pada 11 Februari, seorang operator daya komputasi mengungkapkan kepada wartawan Daily Economic News bahwa saat ini AI sudah banyak digunakan dalam skenario e-commerce, satu jenis adalah konsumsi token (unit teks terkecil) oleh digital human yang cukup signifikan, dan jenis lainnya adalah konsumsi gambar yang dihasilkan AI untuk e-commerce. Arsitek solusi tingkat tinggi dari model besar Qwen, Xiong Hantian, mengatakan dalam wawancara bahwa pembaruan model Qwen-Image-2.0 ini juga dioptimalkan untuk skenario e-commerce, terutama dalam detail produksi produk, tingkat kendali teks, dan pengeditan kedua.

Perlu dicatat bahwa saat ini, gambar yang dihasilkan AI tidak lagi terbatas pada kreasi visual, tetapi semakin melangkah ke jalur aplikasi berskala dan tingkat perusahaan. Pada tahun 2025, teknologi generasi gambar secara bertahap menyusup ke skenario e-commerce dan pasar drama komik, dan seiring kemajuan teknologi gambar AI, akankah pasar aplikasi berskala besar dapat tercapai pada 2026?

Setara dengan Nano Banana Pro, evolusi model gambar AI domestik terus berlanjut

Pada 10 Februari, Alibaba dan ByteDance merilis model generasi gambar. Alibaba merilis model generasi dan pengeditan gambar generasi terbaru Qwen-Image-2.0, sementara platform seperti Jianying dan platform penciptaan AI ByteDance Xiaoyunque meluncurkan model Seedream5.0 Preview, keduanya menargetkan setara dengan Google Nano Banana Pro.

Menurut pengembang Alibaba Qwen, Qwen-Image-2.0 mendukung input teks panjang hingga 1K token dan resolusi tinggi 2K, mampu merender instruksi kompleks secara akurat dan dengan mudah menghasilkan PPT profesional serta infografis. Selain itu, Qwen-Image-2.0 merupakan peningkatan besar dari dua model utama, Qwen-Image dan Qwen-Image-Edit, pertama kali menggabungkan generasi dan pengeditan gambar ke dalam satu model, dengan arsitektur yang lebih ringan, sehingga meningkatkan performa pembuatan gambar asli dan pengeditan secara signifikan.

Sementara itu, ByteDance menyatakan bahwa Seedream 5.0 Preview mendukung output gambar dengan resolusi 2K dan 4K, dan saat ini pengguna dapat mencoba output 2K secara gratis di platform Yimeng.

Seorang eksekutif senior dari perusahaan publik menyatakan bahwa sebelumnya mereka sering menggunakan teknologi gambar AI untuk membuat PPT dan gambar produk perusahaan, tetapi masalah detail teks dan konsistensi gambar masih ada beberapa kekurangan.

Wu Chenfei, kepala visual generasi dari Qwen, menyatakan bahwa kerusakan detail teks dalam gambar AI terutama disebabkan oleh dua faktor. Pertama, saat ini model generasi gambar umumnya menggunakan teknologi VAE (Variational Autoencoder), dan proses rekonstruksi VAE sangat mempengaruhi penanganan teks dalam gambar, terutama teks berukuran kecil. Hal ini karena VAE secara esensial adalah mekanisme kompresi, sehingga ketika konten teks dalam gambar banyak, tingkat kesulitan generasi meningkat secara signifikan dan terbatas oleh kapasitas pemrosesan VAE. Kedua, terbatas oleh kemampuan pemodelan dari model generasi gambar itu sendiri. VAE menentukan batas kemampuan model, dan kemampuan pemodelan dari model generasi langsung mempengaruhi tingkat keaslian dan detail yang dapat direproduksi dalam gambar.

Seberapa jauh gambar AI akan mencapai aplikasi tingkat perusahaan?

Saat ini, seiring dengan iterasi model gambar AI, penggunaannya dalam pasar e-commerce dan drama komik semakin menarik perhatian, dan konsep AI drama komik terus meningkat di pasar modal.

Pada 11 Februari, CEO dan Kepala Analis dari iMedia Research, Zhang Yi, menyatakan bahwa saat ini produksi drama komik AI utama dilakukan dengan gambar yang dihasilkan AI, kemudian diubah menjadi video gambar, dilengkapi dengan pengisian suara dan subtitle AI, untuk menyelesaikan produksi. Ini adalah bentuk industri yang cukup standar saat ini.

Securities East Wu Securities dalam laporan penelitian mereka menunjukkan bahwa AI dapat mengurangi biaya produksi drama komik hingga 90%. Manajer umum divisi animasi AI dari Chinese Online, Zhou Liquang, sebelumnya menyatakan bahwa AI menyederhanakan 11 proses rumit produksi drama komik tradisional menjadi empat langkah: pembuatan naskah, pembuatan gambar, konversi gambar ke video, dan pasca-produksi, sehingga secara besar-besaran meningkatkan kecepatan produksi.

Salah satu masalah utama adalah bahwa pembuatan drama komik AI sangat bergantung pada mode pengambilan gambar secara acak. Masalah terbesar dari mode ini adalah hasil akhir hampir sepenuhnya bergantung pada pemahaman dan kemampuan inferensi AI itu sendiri, sementara pengrajin pengambilan gambar hanya bisa mengasah kata kunci yang diberikan.

Data dari iMedia Research menunjukkan bahwa mayoritas pengguna yakin bahwa teknologi AI memiliki nilai dalam menurunkan biaya produksi (51,2%) dan mempercepat konversi IP (47,7%). Selain itu, hampir setengah pengguna juga menunjukkan bahwa mereka mengalami kekurangan dalam konsistensi gaya visual (47,1%) dan ekspresi suara (46,7%).

Zhang Yi berpendapat bahwa pasar drama komik AI saat ini sedang mengalami pertumbuhan pesat. Dampak teknologi AI terhadap industri drama komik membawa peluang sekaligus tantangan, karena dapat menurunkan biaya produksi dan mempercepat konversi IP, mendorong efisiensi produksi dan peningkatan bentuk konten, tetapi juga menimbulkan masalah kualitas seperti keseragaman gaya visual, kualitas pengisian suara, dan pengembangan karakter, sehingga memaksa industri untuk tidak hanya fokus pada skala besar tetapi juga memperkuat kreativitas dan pengendalian kualitas konten.

Selain drama komik AI, pasar lain yang secara diam-diam diubah oleh gambar AI adalah skenario e-commerce.

Dalam skenario belanja online, terdapat banyak kebutuhan penggunaan gambar. Pada 11 Februari, seorang operator daya komputasi mengungkapkan bahwa gambar yang dihasilkan AI saat ini adalah salah satu kebutuhan utama dari pelanggan e-commerce selain digital human, yang mengkonsumsi token cukup besar.

Xiong Hantian menyatakan bahwa skenario e-commerce adalah salah satu skenario utama penerapan model Qwen-Image, dan pembaruan Qwen-Image-2.0 ini juga didasarkan pada aplikasi skenario e-commerce, serta telah dioptimalkan dan ditingkatkan dari model sebelumnya, berpotensi mendorong penerapan berskala perusahaan.

Sebagai contoh, dalam skenario e-commerce, Xiong Hantian menyatakan bahwa gambar deskripsi halaman produk dan efek pakaian model dapat lebih baik diselesaikan dengan model gambar baru ini. Dibandingkan model generasi gambar sebelumnya yang memerlukan pengeditan kedua untuk mencapai kontrol yang diinginkan, iterasi model baru menggabungkan tugas pengeditan dan generasi gambar dalam satu model, sehingga meningkatkan efisiensi penjual e-commerce.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan

Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)