Aller au contenu

MaQI — Data Documentation

Bienvenue. Cette documentation t'accompagne dans tes premiers pas avec les données du Master AI for Markets and Quantitative Investment (École Polytechnique).

Ce que tu trouveras ici

Architecture data en 30 secondes

flowchart LR
    A[Données brutes<br/>vendor] -->|ingestion| B[Bucket Wasabi<br/>maqi-*<br/>raw]
    B -->|exploration<br/>+ pré-process| C[Bucket Wasabi<br/>maqi-*-clean<br/>parquets propres]
    C -->|DuckDB serverless| D[Notebook Colab<br/>SQL + Python]

Trois principes :

  1. On ne télécharge jamais les données brutes — tout se lit en RAM via Wasabi S3.
  2. Les exports clean sont des parquets partitionnés selon le cas d'usage (pas une seule structure universelle).
  3. DuckDB par-dessus permet d'interroger ces parquets comme une base SQL, sans serveur.

Premier pas

Si tu viens d'arriver et que tu as reçu tes credentials par Signal ou WhatsApp, commence par le Quickstart Colab. Compte 5 à 10 minutes pour ouvrir ton premier notebook et lire un échantillon.

Besoin d'aide

  • Question rapide → Signal / WhatsApp à Emmanuel.
  • Bug ou anomalie → ouvrir une issue sur le repo eserie/maqi-docs.
  • Question de fond sur les données → mail à eserie@gmail.com + charles-albert.lehalle@polytechnique.edu.