Mathématiques de latence : pourquoi la proximité aux exchanges compte pour l'exécution de contrats à terme

2026-05-06 · ~6 minutes de lecture

« Faible latence » est l'affirmation la plus surexploitée du trading crypto retail. La plupart des bots grand public acheminent chaque ordre via un serveur sur le mauvais continent et le vendent comme rapide parce que l'interface se charge vite. Cet article contient les calculs que nous aurions souhaité voir quelqu'un écrire pour nous il y a cinq ans.

Ce que le temps d'aller-retour fait réellement

Le temps d'aller-retour (RTT) est l'intervalle mesuré en temps réel entre « notre ordre quitte notre processus » et « l'accusé de réception de l'exchange atteint notre processus ». Il inclut la jambe réseau sortante, la mise en file d'attente du moteur d'appariement de l'exchange, et la jambe réseau entrante. Il n'inclut pas le temps que nous avons passé à décider d'envoyer l'ordre. (C'est un budget distinct ; nous mesurons les deux.)

Pour un ordre limite passif reposant dans le carnet, le RTT n'a vraiment pas d'importance — une fois l'ordre mis en file d'attente, seule l'horloge de l'exchange compte. Pour un ordre agressif qui prend une cotation que vous avez vue il y a un instant, le RTT est tout : chaque milliseconde que vous passez en transit est une milliseconde de plus pendant laquelle quelqu'un d'autre peut retirer sa cotation.

Où le choix de région de déploiement vous procure quelque chose

Les moteurs d'appariement des exchanges crypto majeurs sont situés dans une poignée de régions physiques — typiquement Singapour, Tokyo, et une zone US-Est. À partir d'un serveur dans la même région, vous pouvez vous attendre à des allers-retours inférieurs à 50 ms. À partir d'un serveur dans la mauvaise région, le même appel prendra généralement 150 à 250 ms, dominé par la vitesse de la lumière dans la fibre optique, pas par l'exchange.

La conséquence pratique : si votre bot envoie des requêtes à un moteur d'appariement de Singapour à partir d'un centre de données américain, vous avez cédé environ 200 ms sur chaque ordre. Sur un ordre agressif, c'est la différence entre remplir au prix affiché et remplir au tick suivant — ou ne pas remplir du tout.

Où ça cesse de vous procurer quelque chose

Au-delà d'environ 30 à 50 ms, la valeur marginale d'une réduction supplémentaire de latence s'effondre pour les stratégies de style retail. Les vrais magasins haute fréquence rivalisent sur des interconnexions co-localisées en micro-secondes — un budget qui ne se rentabilise pas à l'échelle retail, et nous sommes honnêtes à ce sujet en ne jouant pas ce jeu (voir l'article sur ce que haute fréquence signifie réellement dans le crypto retail).

L'objectif réaliste pour un bot d'exécution de qualité retail est : être dans la bonne région, sur un chemin réseau à faible gigue, avec un client bien accordé. Cela vous amène au niveau où le goulot d'étranglement cesse d'être vous et devient la structure du marché.

Comment nous mesurons (et pourquoi nous la publierons)

Nous mesurons le RTT en continu depuis chaque région où nous déployons, par rapport à chaque exchange sur lequel nous tradons. Le chiffre que vous voyez sur la page proof n'est pas « le meilleur jamais enregistré » — c'est une mesure en continu, ce qui est la seule version honnête. Les équipes marketing adorent imprimer le plus bas ; les traders se soucient de la médiane, du 95e percentile, et de la pire minute de la journée.

Quand le flux de données en direct s'activera en Phase 5, le tableau de latence sur la page proof se rafraîchira en continu et indiquera la région actuellement sélectionnée par le routeur pour le flux d'ordres en direct.

Voir la latence en direct sur /proof Comment ça marche Suivant : ce que « haute fréquence » signifie réellement →