Webmaster's Homeの8月8日の報道によると、Netease Interactive AI Labの学術論文「General Image-to-Image Translation with One-Shot Image Guide」がコンピュータビジョンの国際学術会議のトップであるICCV2023に採択された。この論文では、ソース画像の全体構造を変更せずに、オブジェクトやスタイルを参照画像からソース画像に転送できる、VCT (Visual Concept Transformer) と呼ばれる画像編集技術を提案しています。以前のスキームと比較して、VCT にはいくつかの利点があります: 大量のトレーニング データを必要とせず、生成品質と汎化が優れていること、参照ガイドとして画像を使用してより正確な画像編集を実現していること、追加の制御情報を必要としないこと、ソース画像と参照画像から直接、構造情報と意味情報を学習して画像を生成します。