Menurut sebuah laporan oleh Webmaster's Home pada 8 Agustus, sebuah makalah akademik "Terjemahan Gambar-ke-Gambar Umum dengan Bimbingan Gambar Satu Pemotretan" oleh Netease Interactive AI Lab diterima oleh ICCV2023, konferensi akademik visi komputer internasional teratas. Makalah ini mengusulkan teknik pengeditan gambar yang disebut VCT (Visual Concept Transformer), yang dapat mentransfer objek atau gaya ke gambar sumber dari gambar referensi sambil mempertahankan keseluruhan struktur gambar sumber tidak berubah. Dibandingkan dengan skema sebelumnya, VCT memiliki beberapa keunggulan: tidak memerlukan data pelatihan dalam jumlah besar, dan kualitas generasi dan generalisasi lebih baik; menggunakan gambar sebagai panduan referensi untuk mencapai pengeditan gambar yang lebih akurat; tidak memerlukan informasi kontrol tambahan , langsung dari sumber Gambar dan gambar referensi mempelajari informasi struktural dan semantik untuk menghasilkan gambar.