Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
FastVLM muncul, memberi kamu sesuatu yang berbeda!✨
Mereka menempelkan MLP di FastViTHD, mengusulkan token visual di dunia LLM.
Hasil? Jumlah token berkurang drastis, 4 kali lebih sedikit daripada FastViT, 16 kali lebih sedikit daripada ViT‑L/14, resolusi 336 piksel!😲
Token berkurang, kompleksitas juga menurun, ini benar-benar seperti sukses diet di dunia token!🤣📉