é aqui que o FastVLM entra em cena



eles aplicam um MLP para projetar tokens visuais do FastViTHD para o mundo do LLM

o resultado: muito menos tokens ( como 4× menos que o FastViT, 16× menos que o ViT‑L/14 a 336‑pixel res). Quero dizer, isso é uma grande diminuição na contagem de tokens e complexidade, enquanto
IN3.65%
MLP1.01%
PIXEL3.8%
TOKEN5.15%
Ver original
post-image
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 5
  • Republicar
  • Partilhar
Comentar
0/400
GasFeeLovervip
· 7h atrás
Assim seja. O que há para se gabar?
Ver originalResponder0
ser_we_are_earlyvip
· 7h atrás
Parece que o FastVLM é realmente fantástico!
Ver originalResponder0
BlockchainBardvip
· 7h atrás
Estou impressionado, fiquei chocado com a quantidade de tokens.
Ver originalResponder0
WhaleWatchervip
· 7h atrás
Já estão a fazer coisas novas!
Ver originalResponder0
DiamondHandsvip
· 7h atrás
Ah ah, estou um pouco confuso com o que foi dito...
Ver originalResponder0
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)