MaQI — Data Documentation¶
Bienvenue. Cette documentation t'accompagne dans tes premiers pas avec les données du Master AI for Markets and Quantitative Investment (École Polytechnique).
Ce que tu trouveras ici¶
- Quickstart Colab — ouvrir ton premier notebook en 5 minutes.
- Catalogue des données — datasets disponibles, granularité, période couverte.
- Authentification & politique d'usage — credentials, double-auth, règles de non-redistribution.
- Notebooks de référence — exemples cliquables pour explorer chaque dataset.
- DuckDB sur Wasabi — comment requêter les parquets propres en SQL serverless.
- FAQ — troubleshooting des problèmes courants.
Architecture data en 30 secondes¶
flowchart LR
A[Données brutes<br/>vendor] -->|ingestion| B[Bucket Wasabi<br/>maqi-*<br/>raw]
B -->|exploration<br/>+ pré-process| C[Bucket Wasabi<br/>maqi-*-clean<br/>parquets propres]
C -->|DuckDB serverless| D[Notebook Colab<br/>SQL + Python]
Trois principes :
- On ne télécharge jamais les données brutes — tout se lit en RAM via Wasabi S3.
- Les exports clean sont des parquets partitionnés selon le cas d'usage (pas une seule structure universelle).
- DuckDB par-dessus permet d'interroger ces parquets comme une base SQL, sans serveur.
Premier pas¶
Si tu viens d'arriver et que tu as reçu tes credentials par Signal ou WhatsApp, commence par le Quickstart Colab. Compte 5 à 10 minutes pour ouvrir ton premier notebook et lire un échantillon.
Besoin d'aide¶
- Question rapide → Signal / WhatsApp à Emmanuel.
- Bug ou anomalie → ouvrir une issue sur le repo
eserie/maqi-docs. - Question de fond sur les données → mail à
eserie@gmail.com+charles-albert.lehalle@polytechnique.edu.