Market Data
Collecte et normalisation des données de marché.
Projet Liora
Ce projet a été réalisé dans le cadre de ma formation Data Engineer chez Liora (ex-Datascientest), avec un niveau de difficulté annoncé de 8/10. Il s'agit d'un bot de trading capable d'observer des marchés de cryptomonnaies en temps réel, de collecter et stocker des données historiques, d'entraîner des modèles de Machine Learning, et de proposer des décisions d'achat, de vente ou de standby.
Dès le départ, j'ai choisi d'aborder ce projet comme je le ferais en entreprise : non pas comme un exercice à valider, mais comme une application destinée à vivre, évoluer et être utilisée par d'autres.
Une architecture pensée pour l'extensibilité : Toutes les dimensions structurantes de l'application sont paramétrables via des variables d'environnement : cryptomonnaies à surveiller, intervalles de candlesticks, fenêtres de lags et d'horizons de prédiction, features techniques (EMA, SMA, MACD, RSI…), modèles ML disponibles.
Ce qui permet d'aller vers des scénarios d'upscale réels : + de cryptos, + de features... autant de questions que l'on rencontre dans de vrais projets de data engineering.
Une posture orientée équipe et usage : J'ai également intégré des fonctionnalités non demandées dans le cahier des charges, comme un système de dump automatique et régulier de la base de données, qui a été exposée h24 aux services d'ingestion dès le 2ème sprint.
Partant du principe que la donnée est le nerf de la guerre en data engineering, il m'a semblé important, au cours de la phase de développement, de faire persister les données collectées depuis le début du projet, et de les mettre à disposition de tous les développeurs de l'équipe, en particulier en cas de redéploiement du projet sur une nouvelle machine de développement.
Ainsi, l'équipe de développement a toujours eu un maximum de données disponibles, ce qui est appréciable aussi en tant que data scientist pour la phase de Machine Learning.
Cette décision reflète ma façon de travailler : anticiper les besoins des autres acteurs du projet — les data scientists en l'occurrence — et être force de proposition pour les mettre dans les meilleures conditions.
Roadmap
Architecture
Collecte et normalisation des données de marché.
Génération de signaux et logique d’automatisation.
Exposition, sizing, stop-loss et garde-fous.
Validation historique, drawdown et robustesse.
Logs, métriques, alertes et suivi d’exécution.
Déploiement Docker sur Proxmox et Debian.