Matemática de latencia: por qué la proximidad al exchange importa para la ejecución de futuros

2026-05-06 · ~6 minutos de lectura

"Baja latencia" es la frase más sobre-afirmada en el trading de criptomonedas minorista. La mayoría de los bots de grado consumidor enrutan cada orden a través de un servidor en el continente equivocado y lo llaman rápido porque la interfaz se siente ágil. Este artículo es la matemática que deseábamos que alguien hubiera escrito para nosotros hace cinco años.

Qué es realmente el tiempo de ida y vuelta

El tiempo de ida y vuelta (RTT) es el intervalo de reloj entre "nuestra orden sale de nuestro proceso" y "el reconocimiento del exchange llega a nuestro proceso". Incluye la pata de red de salida, el encolamiento del motor de coincidencias del exchange, y la pata de red de entrada. No incluye el tiempo que pasamos decidiendo enviar la orden. (Ese es un presupuesto separado; medimos ambos.)

Para una orden límite pasiva que descansa en el libro, RTT realmente no importa — una vez que la orden está en cola, el reloj del exchange es el único que cuenta. Para una orden agresiva que saca una cotización que viste hace un momento, RTT es todo: cada milisegundo que pasas en vuelo es otro milisegundo en el que alguien más puede retirar su cotización.

Dónde la región de despliegue te compra algo

Los motores de coincidencias de exchange para los principales venues de criptomonedas viven en un puñado de regiones físicas — típicamente Singapur, Tokio, y una zona US-Este. Desde un servidor en la misma región puedes esperar RTT por debajo de 50 ms. Desde un servidor en la región equivocada, la misma llamada rutinariamente tomará 150 a 250 ms, dominada por la velocidad de la luz a través de fibra, no por el exchange.

La consecuencia práctica: si tu bot está haciendo ping a un motor de coincidencias de Singapur desde un centro de datos de EE.UU., has renunciado a aproximadamente 200 ms en cada orden. En una orden agresiva, esa es la diferencia entre llenar al precio mostrado y llenar en el siguiente tick — o no llenar en absoluto.

Dónde deja de comprarte nada

Pasado algo alrededor de 30 a 50 ms, el valor marginal de una reducción adicional de latencia colapsa para estrategias de estilo minorista. Las tiendas realmente de alta frecuencia compiten en interconexiones co-localizadas de microsegundos — un presupuesto que no se recupera en tamaño minorista, y somos honesto sobre no jugar ese juego (ver el artículo sobre lo que alta frecuencia realmente significa en criptomonedas minoristas).

El objetivo realista para un bot de ejecución de grado minorista es: estar en la región correcta, en una ruta de red de bajo jitter, con un cliente bien sintonizado. Eso te lleva al piso donde el cuello de botella deja de ser tú y comienza a ser la estructura del mercado.

Cómo medimos (y por qué lo publicaremos)

Medimos RTT continuamente desde cada región en la que desplegamos, contra cada exchange en el que operamos. El número que ves en la página de proof no es el "mejor jamás registrado" — es una medición continua, que es la única versión honesta. Los equipos de marketing aman imprimir el piso; los traders se preocupan por la mediana, el percentil 95, y el peor minuto del día.

Cuando el feed de datos en vivo se encienda en la Fase 5, la tabla de latencia en la página de proof se actualizará continuamente y etiquetará la región actualmente seleccionada por el router para el flujo de órdenes en vivo.

Ver latencia en vivo en /proof Cómo funciona Siguiente: qué 'alta frecuencia' realmente significa →