La Biblia del arbitraje en Polymarket: la verdadera diferencia está en la infraestructura matemática

MarsBitNews · 2026-03-11T05:17:48+00:00

Título original: La matemática necesaria para operar en Polymarket (Hoja de ruta completa)Autor original: RoanFuente original:Reproducción: Mars FinanceEn el proceso de crear @insidersdotbot, he tenido profundas conversaciones con varios equipos de market makers de alta frecuencia y equipos de arbitraje, entre ellas, la mayor necesidad es cómo diseñar estrategias de arbitraje.Nuestros usuarios, amigos, socios, todos están explorando el complejo y multidimensional camino del arbitraje en Polymarket. Si eres un usuario activo de Twitter, entonces creo que también habrás visto alguna vez «Yo a través de

MarsBitNews

2026-03-11 05:17:48

El título original: The Math Needed for Trading on Polymarket (Complete Roadmap)

El autor original: Roan

Fuente original:

Reproducción: Mars Finance

En el proceso de crear @insidersdotbot, he tenido profundas conversaciones con varios equipos de market makers de alta frecuencia y equipos de arbitraje. Entre sus principales necesidades, está cómo diseñar estrategias de arbitraje.

Nuestros usuarios, amigos y socios están explorando la compleja y multidimensional ruta del arbitraje en Polymarket. Si eres un usuario activo de Twitter, seguramente has visto tweets como «Con la estrategia de arbitraje XX, gané tanto en el mercado de predicciones».

Sin embargo, la mayoría de los artículos simplifican demasiado la lógica subyacente del arbitraje, convirtiéndolo en un «yo también puedo», «con Clawdbot se resuelve», sin explicar en detalle cómo entender y desarrollar un sistema de arbitraje propio de forma sistemática.

Si quieres entender cómo las herramientas de arbitraje en Polymarket generan ganancias, este artículo es la interpretación más completa que he visto hasta ahora.

Dado que el texto original en inglés contiene muchas partes demasiado técnicas y que requieren investigación adicional, lo he reestructurado y complementado para que puedas entender todos los puntos clave con solo este artículo, sin tener que detenerte a buscar información.

El arbitraje en Polymarket no es solo un problema matemático simple

Ves un mercado en Polymarket:

Precio YES $0.62, NO $0.33.

Piensas: 0.62 + 0.33 = 0.95, menos de 1 dólar, hay oportunidad de arbitraje. Compras YES y NO por un total de $0.95, y sin importar el resultado, recuperas $1.00, ganando $0.05 de forma segura.

Estás en lo correcto.

Pero el problema es que — mientras tú aún haces cálculos manuales, los sistemas cuantitativos ya están haciendo algo completamente diferente.

Están escaneando simultáneamente 17,218 condiciones, cubriendo 2^63 posibles combinaciones de resultados, y en milisegundos encuentran todas las contradicciones de precios. Cuando tú colocas dos órdenes, la diferencia de precio ya desapareció. El sistema ya encontró en decenas de mercados relacionados la misma vulnerabilidad, calculó el tamaño óptimo de la posición considerando el libro de órdenes y las comisiones, ejecutó todas las transacciones en paralelo y movió los fondos hacia la próxima oportunidad.[1]

La diferencia no es solo velocidad. Es infraestructura matemática.

Capítulo 1: Por qué «suma» no basta — Problema del poliedro marginal

Error en un mercado simple

Veamos un ejemplo sencillo.

Mercado A: «¿Ganará Trump en las elecciones de Pensilvania?»

Precio YES $0.48, NO $0.52. La suma es exactamente $1.00.

Parece perfecto, sin oportunidad de arbitraje, ¿verdad?

Falso.

Agrega un mercado B: «¿El Partido Republicano superará en Pensilvania a su oponente por más de 5 puntos porcentuales?»

YES $0.32, NO $0.68. También suma $1.00.

Cada mercado parece «normal». Pero hay una dependencia lógica:

Las elecciones presidenciales en EE. UU. no se cuentan en todo el país de una vez, sino por estado. Cada estado es un «campo de batalla» independiente, y quien obtenga más votos en ese estado gana todos los votos electorales (sistema de «el ganador se lleva todo»). Trump es candidato republicano. Entonces, «el Partido Republicano gana en Pensilvania» y «Trump gana en Pensilvania» — son la misma cosa. Si el Partido Republicano gana por más de 5 puntos, eso implica que Trump ganó en Pensilvania y, además, con una diferencia significativa.

En otras palabras, el YES del mercado B (gran victoria republicana) es un subconjunto del YES del mercado A (Trump gana). Una victoria grande implica ganar, pero ganar no siempre implica una victoria grande.

Esta dependencia lógica crea oportunidades de arbitraje.

Es como apostar a dos cosas: «¿Lloverá mañana?» y «¿Habrá tormenta eléctrica mañana?»

Si hay tormenta, necesariamente lloverá (la tormenta es un subconjunto de la lluvia). Por lo tanto, el precio de «tormenta YES» no puede ser mayor que el de «lluvia YES». Si los precios en el mercado violan esa lógica, puedes comprar barato y vender caro simultáneamente, ganando un «beneficio sin riesgo», y eso es arbitraje.

Explosión de combinaciones: por qué la búsqueda exhaustiva no funciona

Para cualquier mercado con n condiciones, teóricamente hay 2^n combinaciones posibles de precios.

¿Suena manejable? Veamos un caso real.

Mercado del NCAA 2010 [2]: 63 partidos, cada uno con dos resultados posibles. El número de combinaciones posibles es 2^63 = 9,22 trillones, más de 9 quintillones. Hay más de 5000 mercados en la plataforma.

¿Cuánto es 2^63? Si revisas 1,000 millones de combinaciones por segundo, tardarías aproximadamente 292 años en revisar todas. Por eso, la búsqueda exhaustiva aquí es inviable.

Revisar cada combinación individualmente es computacionalmente imposible.

Para las elecciones de EE. UU. en 2024, un equipo de investigación encontró 1,576 pares de mercados con dependencias potenciales. Si cada par tiene 10 condiciones, hay 2^10 = 1024 combinaciones por par. Multiplicado por 1,576 pares, ¡tu portátil terminaría de analizar antes de que se conozca el resultado!

Programación entera: usar restricciones en lugar de enumerar

La solución de los sistemas cuantitativos no es «enumerar más rápido», sino no enumerar en absoluto.

Utilizan programación entera (Integer Programming) para describir qué resultados son legales.

Veamos un ejemplo real. Mercado de Duke vs Cornell: cada equipo tiene 7 posibles resultados (de 0 a 6 victorias), total 14 condiciones, y 2^14 = 16,384 combinaciones posibles.

Pero hay una restricción: no pueden ganar más de 4 partidos, porque si no, se enfrentan en semifinales (solo uno puede avanzar).

¿Cómo se usa programación entera? Con tres restricciones lineales:

· Restricción 1: En los 7 resultados de Duke, exactamente uno es verdadero (Duke solo puede tener un número final de victorias).

· Restricción 2: En los 7 resultados de Cornell, exactamente uno es verdadero.

· Restricción 3: La suma de victorias de Duke y Cornell en ciertos resultados no puede ser mayor que 1 (no pueden ganar ambos en exceso).

Estas tres restricciones lineales reemplazan la revisión de 16,384 combinaciones.

En otras palabras, en lugar de revisar todas las combinaciones, simplemente describes «cómo son los resultados legales» y dejas que el algoritmo busque las que violan esas reglas.

Datos reales: el 41% de los mercados tienen arbitraje [2]

El estudio analizó datos de abril 2024 a abril 2025:

• Revisaron 17,218 condiciones

• 7,051 condiciones tenían arbitraje en un solo mercado (41%)

• Desviación mediana en precios: $0.60 (debería ser $1.00)

• 13 pares de mercados con arbitraje cruzado confirmado

Una desviación mediana de $0.60 indica que los mercados se desvían en promedio un 40%. Esto no es «casi eficiente», sino «gran oportunidad de arbitraje».

Capítulo 2: Proyección de Bregman — Cómo calcular la mejor operación de arbitraje

Encontrar arbitraje es un problema. Calcular la operación óptima, otro.

No basta con «promediar» o «ajustar precios». Hay que proyectar el estado actual del mercado en el espacio legal sin arbitraje, conservando la estructura de la información en los precios.

Por qué la «distancia en línea recta» no funciona

La idea más simple sería: encontrar el precio «legal» más cercano al actual, y hacer la diferencia.

En términos matemáticos, minimizar la distancia Euclidiana: ||μ - θ||²

Pero esto tiene un problema fatal: trata todos los cambios de precio igual.

Subir de $0.50 a $0.60 y de $0.05 a $0.15, ambos son incrementos de 10 centavos. Pero la información que representan es muy diferente.

¿Por qué? Porque los precios representan probabilidades implícitas. Pasar de 50% a 60% es un ajuste suave en la creencia. Pero pasar de 5% a 15% implica un cambio de creencia enorme — un evento casi imposible que ahora se vuelve «algo posible».

Imagina que pesas: de 70 kg a 80 kg, dirías «engordé un poco». Pero de 30 kg a 40 kg (si eres adulto), sería «casi en estado de desnutrición». La misma variación de 10 kg, pero con significados muy diferentes. Lo mismo pasa con los precios: cuanto más cerca de 0 o 1, mayor es la información que contienen los cambios.

Discrepancia de Bregman: la «distancia» correcta

Los market makers en Polymarket usan LMSR (regla de puntuación de mercado logarítmica)[4], donde los precios representan distribuciones de probabilidad.

En esta estructura, la medida correcta de distancia no es Euclidea, sino la divergencia de Bregman.[5]

Para LMSR, la divergencia de Bregman se convierte en la divergencia KL (Kullback-Leibler)[6], que mide la «distancia informacional» entre dos distribuciones de probabilidad.

No necesitas memorizar la fórmula. Solo entender que:

La divergencia KL asigna mayor peso a los cambios en precios extremos. De $0.05 a $0.15, la diferencia es más significativa que de $0.50 a $0.60 en términos de divergencia KL. Esto coincide con nuestra intuición: cambios en precios extremos implican mayores impactos informacionales.

Un ejemplo claro fue en el mercado de @zachxbt, donde Axiom en el último momento superó a Meteora, con cambios extremos en precios, que marcaron toda la dinámica.

Ganancia de arbitraje = distancia en la proyección de Bregman

Esta es una de las conclusiones clave del artículo original:

Cualquier ganancia garantizada máxima que puedas obtener, es igual a la distancia en la proyección de Bregman desde el estado actual del mercado hasta el espacio sin arbitraje.

En otras palabras: cuanto más se desvíen los precios del «espacio legal», mayor será la ganancia potencial. La proyección de Bregman te indica:

Qué comprar o vender (dirección de la proyección)
Cuánto comprar o vender (considerando el libro de órdenes)
Cuánto puedes ganar (la distancia de la proyección, que es la ganancia máxima)

El primer lugar en ganancias de arbitraje en un año ganó $2,009,631.76.[2] Su estrategia fue resolver más rápido y con mayor precisión este problema de optimización.

Imagina que estás en una montaña, en la base hay un río (el espacio sin arbitraje). Tu posición actual (precio del mercado) está a cierta distancia del río.

La proyección de Bregman te ayuda a encontrar «el camino más corto desde tu posición hasta el río» — no en línea recta, sino considerando el terreno (estructura del mercado). La longitud de ese camino es la ganancia máxima posible.

Capítulo 3: Algoritmo de Frank-Wolfe — Cómo convertir la teoría en código ejecutable

Ahora sabes que para calcular el arbitraje óptimo, necesitas hacer la proyección de Bregman.

Pero el problema es que — calcular directamente esa proyección no es factible.

¿Por qué? Porque el espacio sin arbitraje (el poliedro marginal M) tiene un número exponencial de vértices. Los métodos estándar de optimización convexa requieren acceder a todas las restricciones, es decir, enumerar cada resultado legal. Como mencionamos, eso no escala.

El núcleo del método Frank-Wolfe

La genialidad del algoritmo Frank-Wolfe [7] es que no intenta resolver todo de una vez, sino que se acerca paso a paso.

Funciona así:

Paso 1: Comienza con un conjunto pequeño de resultados legales conocidos.

Paso 2: Optimiza en ese conjunto para encontrar la mejor solución actual.

Paso 3: Usa programación entera para encontrar un nuevo resultado legal, y lo añade al conjunto.

Paso 4: Verifica si la solución es suficientemente cercana a la óptima. Si no, vuelve al paso 2.

Cada iteración añade solo un vértice. Aunque hagas 100 iteraciones, solo rastreas 100 vértices — no 2^63.

Es como buscar la salida en un laberinto gigante.

El método de programación entera: el «guía» en cada paso

Cada iteración de Frank-Wolfe requiere resolver un problema de programación lineal entera. En teoría, esto es NP-hard (no hay algoritmo rápido conocido).

Pero los solucionadores modernos, como Gurobi[8], pueden resolverlo eficientemente en problemas bien estructurados.

El equipo usó Gurobi 5.5. El tiempo de resolución en la práctica:

• Primera etapa (pocas partidas): menos de 1 segundo

• Etapa media (30-40 partidos): 10-30 segundos

• Etapa final (más de 50 partidos): menos de 5 segundos

¿Por qué más rápido en la fase final? Porque a medida que los resultados se fijan, el espacio factible se reduce. Menos variables, restricciones más estrictas, resolución más rápida.

Problema de explosión de gradientes y método Barrier Frank-Wolfe

El método estándar de Frank-Wolfe tiene un problema técnico: cuando los precios se acercan a 0, la gradiente del LMSR tiende a -infinito, lo que puede hacer inestable el algoritmo.

La solución es Barrier Frank-Wolfe: en lugar de optimizar en el poliedro completo M, se optimiza en una versión ligeramente «reducida» de M. El parámetro de reducción ε se ajusta de forma adaptativa: al principio, se mantiene alejado de los bordes (estable), y luego se acerca progresivamente (preciso).

Los estudios muestran que con 50 a 150 iteraciones, suele ser suficiente para converger.

Desempeño real

El artículo revela [2]:

En las primeras 16 partidas del NCAA, el market maker de Frank-Wolfe (FWMM) y el market maker con restricciones lineales simples (LCMM) tuvieron resultados similares — porque el solver de programación entera aún era lento.

Pero después de 45 partidas, la proyección en 30 minutos se completó con éxito.

Desde entonces, FWMM superó en precio a LCMM en un 38%.

El punto clave fue cuando el espacio de resultados se redujo lo suficiente para que el solver pudiera resolver en el tiempo de la operación.

FWMM es como un estudiante que calienta en la primera mitad del examen, pero cuando entra en ritmo, arrasa. LCMM es ese estudiante estable, con techo limitado. La diferencia principal: FWMM tiene una «arma» más potente (la proyección de Bregman), solo necesita tiempo para «cargar el arma» (ejecutar el solver).

Capítulo 4: Ejecución — Por qué, aunque calcules, aún puedas perder dinero

Detectaste arbitraje. Calculaste la mejor operación con Bregman.

Ahora, hay que ejecutarla.

Aquí es donde fallan la mayoría de las estrategias.

Problema de ejecución no atómica

Polymarket usa CLOB (central limit order book)[9]. A diferencia de los DEX, las órdenes en CLOB se ejecutan en orden secuencial — no garantizan ejecución atómica.

Tu plan de arbitraje:

Compra YES a $0.30. Compra NO a $0.30. Costo total $0.60. Sin importar el resultado, recuperas $1.00. Ganancia $0.40.

Pero en la práctica:

· Envías orden de compra YES → se ejecuta a $0.30 ✓

· Tu orden cambia el precio del mercado.

· Envías orden de compra NO → se ejecuta a $0.78 ✗

· Costo total: $1.08. Recuperas $1.00. Resultado real: pérdida de $0.08.

Una de las órdenes se ejecutó, la otra no. Quedaste expuesto.

Por eso, la investigación solo cuenta oportunidades con diferencia de precio superior a $0.05. Las diferencias menores se pierden por riesgo de ejecución.

VWAP: precio real de ejecución

No asumas que puedes comprar al precio cotizado. Calcula el precio medio ponderado por volumen (VWAP)[10].

El equipo analizó cada bloque en Polygon (cada 2 segundos aprox.), y calculó el VWAP de todas las transacciones YES y NO en ese bloque. Si |VWAP_yes + VWAP_no - 1.0| > 0.02, lo registra como oportunidad de arbitraje [2].

El VWAP refleja el precio promedio real que pagaste. Si quieres comprar 10,000 tokens, pero en el libro hay solo 2,000 a $0.30, 3,000 a $0.32 y 5,000 a $0.35, tu VWAP será (2000×0.30 + 3000×0.32 + 5000×0.35) / 10000 = $0.326, más alto que el precio «óptimo» de $0.30.

Restricciones de liquidez: cuánto puedes ganar depende de la profundidad del libro

Aunque los precios tengan desviaciones, las ganancias reales están limitadas por la liquidez disponible.

Ejemplo real [2]:

El mercado muestra arbitraje: suma de precios YES = $0.85. Ganancia potencial: $0.15 por dólar. Pero la profundidad del libro en esos precios solo es $234. La ganancia máxima posible: $234 × 0.15 = $35.10.

Para arbitraje cruzado, necesitas liquidez en todas las posiciones simultáneamente. La menor de ellas determina tu límite.

Por eso, en plataformas cuantitativas, mostrar cómo el precio del libro afecta la ejecución es crucial.

Capítulo 5: Sistema completo — ¿Qué se ha implementado en la práctica?

La teoría es limpia. El entorno productivo, desordenado.

Este es un ejemplo de un sistema de arbitraje que realmente funciona [2].

Pipeline de datos

Datos en tiempo real: conexión WebSocket a la API de Polymarket [9], recibe actualizaciones del libro, transacciones, eventos de creación y liquidación de mercados.

Datos históricos: consulta en la API de Alchemy Polygon, eventos de contratos — OrderFilled (ejecución), PositionSplit (creación de tokens), PositionsMerge (quema de tokens).

El equipo analizó 86 millones de transacciones [2]. Este volumen requiere infraestructura, no puede hacerse con scripts simples.

También planean abrir una API de trading de alta velocidad. Si quieres usar un modelo similar, contacta conmigo para acceder a la API en primera mano.

Capa de detección de dependencias

Para 305 mercados de la elección presidencial en EE. UU., hay 46,360 pares de combinaciones potenciales. Analizarlos manualmente es imposible.

El equipo usó un modelo de lenguaje grande (LLM) llamado DeepSeek-R1-Distill-Qwen-32B para prefiltrar.

Entrada: descripción de condiciones de dos mercados. Salida: JSON con combinaciones legales.

Luego, tres niveles de validación:

¿Cada mercado tiene exactamente una condición verdadera?
¿El número de combinaciones legales es menor que n×m (dependencias)?
¿Las dependencias cumplen con las condiciones de arbitraje?

Resultados: 40,057 pares independientes (sin arbitraje), 1,576 con dependencias (potencial arbitraje), 374 cumplen condiciones estrictas, y 13 son verificadas manualmente como explotables [2].

El LLM tiene una precisión del 81.45% en mercados complejos con múltiples condiciones. Es suficiente para prefiltrar, pero antes de actuar, requiere revisión humana.

Motor de optimización en tres niveles

· Primer nivel: restricciones lineales simples (LCMM). Verificación rápida — suma de probabilidades igual a 1, y que A implica B, P(A) no puede ser mayor que P(B). Resuelve en milisegundos, elimina errores evidentes.

· Segundo nivel: proyección con programación entera (Frank-Wolfe + Gurobi). Es el núcleo. Parámetros: Alpha=0.9 (extraer al menos 90% del arbitraje), ε inicial=0.1 (10% de reducción), umbral de convergencia=1e-6, límite de tiempo=30 minutos. Iteraciones típicas: 50-150. Tiempo por iteración: 1-30 segundos.

· Tercer nivel: validación de ejecución. Antes de enviar órdenes, simula la ejecución en el libro actual. Verifica: ¿hay suficiente liquidez? ¿Cuál es el slippage esperado? ¿Cuánto se gana tras descontar slippage? ¿El beneficio supera el umbral mínimo ($0.05)? Solo si pasa todo, se ejecuta.

Gestión de posiciones: versión mejorada de la fórmula de Kelly

La fórmula de Kelly estándar [11] indica qué proporción de fondos invertir. Pero en arbitraje, hay que ajustar por riesgo de ejecución:

f = (b×p - q) / b × √p

donde b es el porcentaje de ganancia, p es la probabilidad de ejecución completa (estimada por la profundidad del libro), q=1-p.

Límite: 50% de la profundidad del libro. Si se excede, la orden puede mover mucho el mercado.

Resultados finales

De abril 2024 a abril 2025, ganancias totales:

Arbitraje en condiciones simples: compra baja y venta alta en ambos lados: $5,899,287 + $4,682,075 = $10,581,362

Rebalanceo de mercado: compra en todos los YES por $11,092,286, venta en todos los YES por $612,189, compra en todos los NO por $17,307,114, total: $29,011,589

Arbitraje cruzado entre mercados: $95,634

Total: $39,688,585

Los 10 mejores ganaron $8,127,849 (20.5% del total). El primero, con 4,049 transacciones, ganó $2,009,632, con un promedio de $496 por operación [2].

No es lotería. No es suerte. Es ejecución sistemática con precisión matemática.

La realidad final

Mientras los traders leen «10 trucos para predecir mercados», los sistemas cuantitativos están haciendo:

Detectar dependencias entre 17,218 condiciones con programación entera
Calcular la operación de arbitraje óptima con Bregman
Ejecutar Frank-Wolfe para evitar explosión de gradientes
Estimar slippage con VWAP y ejecutar órdenes en paralelo
Extraer sistemáticamente 40 millones de dólares en beneficios garantizados

La diferencia no es suerte. Es infraestructura matemática.

El artículo está publicado [1]. Los algoritmos son conocidos. Las ganancias, reales.

La pregunta es: ¿puedes construirlo antes de que se extraigan otros 40 millones?

Resumen conceptual

• Poliedro marginal (Marginal Polytope) → espacio de todos los precios «legales». Los precios deben estar en este espacio para ser sin arbitraje. Es la «zona legal» de precios.

• Programación entera (Integer Programming) → describir resultados legales con restricciones lineales, evitando enumerar. Reduce 2^63 revisiones a unas pocas restricciones [3].

• Divergencia de Bregman / KL → método para medir «distancia» entre distribuciones de probabilidad, más adecuado que Euclidea en precios y probabilidades. Da mayor peso a cambios extremos [5][6].

• LMSR (regla de puntuación logarítmica) → mecanismo de precios en Polymarket, donde los precios representan probabilidades implícitas [4].

• Algoritmo de Frank-Wolfe → método iterativo que añade un vértice a la vez, evitando enumerar combinaciones exponenciales [7].

• Gurobi → solucionador líder en programación entera, que actúa como «guía» en cada iteración [8].

• CLOB (central limit order book) → mecanismo de emparejamiento en Polymarket, órdenes en orden secuencial, sin garantía de atomicidad [9].

• VWAP (precio medio ponderado por volumen) → precio promedio real pagado, considerando la profundidad del libro. Es más realista que el precio «óptimo» [10].

• Fórmula de Kelly → indica qué proporción de fondos invertir, equilibrando ganancia y riesgo [11].

• Ejecución no atómica → problema de que varias órdenes no se ejecuten simultáneamente, exponiéndote a riesgo.

• DeepSeek → modelo de lenguaje grande para prefiltrar dependencias de mercado, con precisión del 81.45%.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

1 me gusta