08:56
1月5日にWebmaster's Homeが報じたように、Hugging Faceチームは、Stable Diffusionのような他の競合他社よりも速く、わずか数秒で画像を生成できるaMUSEdと呼ばれる新しいモデルで物事をスピードアップしようとしています。  この軽量なテキストから画像へのモデルは、GoogleのMUSEモデルに基づいており、パラメータサイズは約8億です。 aMUSEdは、モバイルデバイスなどのデバイスに展開できます。 そのスピードは、その作り方から生まれます。 aMUSEdは、安定拡散モデルやその他の画像生成モデルに見られる潜在拡散の代わりに、マスク画像モデル(MIM)と呼ばれるアーキテクチャを採用しています。 Hugging Faceチームによると、MIMは推論ステップを減らし、モデルの速度と説明可能性を向上させます。 また、サイズが小さいため、高速です。
- 1

