Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
TradFi
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
Pre-IPOs
Accede al acceso completo a las OPV de acciones globales
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Centro de patrimonio VIP
Planes de aumento patrimonial prémium
Gestión patrimonial privada
Asignación de activos prémium
Quant Fund
Estrategias cuantitativas de alto nivel
Staking
Haz staking de criptomonedas para ganar en productos PoS
Apalancamiento inteligente
Apalancamiento sin liquidación
Acuñación de GUSD
Acuña GUSD y gana rentabilidad de RWA
Promociones
Centro de actividades
Únete a actividades y gana recompensas
Referido
20 USDT
Invita amigos y gana por tus referidos
Programa de afiliados
Gana recompensas de comisión exclusivas
Gate Booster
Aumenta tu influencia y gana airdrops
Anuncio
Novedades de plataforma en tiempo real
Blog de Gate
Artículos del sector de las criptomonedas
AI
Gate AI
Tu compañero de IA conversacional para todo
Gate AI Bot
Usa Gate AI directamente en tu aplicación social
GateClaw
Gate Blue Lobster, listo para usar
Gate for AI Agent
Infraestructura de IA, Gate MCP, Skills y CLI
Gate Skills Hub
+10 000 habilidades
De la oficina al trading, una biblioteca de habilidades todo en uno para sacar el máximo partido a la IA
GateRouter
Elige inteligentemente entre más de 30 modelos de IA, con 0% de costos adicionales
Me pareció muy interesante esta historia de NVIDIA con Groq. Básicamente, lo que Huang Renxun explicó ahora tiene mucho sentido estratégico.
Todo comenzó porque el mercado de inferencia cambió. Antes, todos se enfocaban en una sola cosa: aumentar el rendimiento, procesar más solicitudes al mismo tiempo. Pero luego la gente se dio cuenta de que no siempre funciona así en la práctica. Algunos usuarios están dispuestos a pagar más por respuestas más rápidas, independientemente del volumen total.
Es como esto: tienes dos modelos iguales, pero uno responde en 50ms y otro en 500ms. Si eres un ingeniero desarrollando una aplicación en tiempo real, ¿cuánto pagarías más por aquel que es 10 veces más rápido? Exacto, ese mercado de baja latencia es totalmente diferente al de alto rendimiento.
Ahí entra Groq en esta historia. La arquitectura LPU de ellos está justamente especializada en eso, en baja latencia determinista. Mientras las GPUs de NVIDIA dominan el lado del rendimiento masivo, Groq llena un hueco completamente diferente. Cuando miras el Groq 3 LPU que salió en marzo, hecho en 4nm por Samsung, la capacidad de inferencia por megavatio en modelos trilionarios es 35 veces mejor que el Blackwell NVL72. Eso no es poca cosa.
Lo que Huang básicamente está diciendo es que NVIDIA entendió que no existe un único mercado de inferencia, sino dos segmentos muy distintos con dinámicas de precios completamente diferentes. Puedes tener menor rendimiento, pero si el precio unitario por token es mucho más alto, compensa. Es como expandir la frontera de Pareto del mercado.
Esa fue una jugada muy bien pensada de NVIDIA, en realidad. Reconocieron una brecha y fueron tras ella. Jonathan Ross y el equipo de Groq siguen operando de forma independiente, pero ahora con todo el peso de NVIDIA detrás. Parece que finalmente alguien está pensando en inferencia de forma más sofisticada.