Aller au contenu

Quickstart Colab

Objectif : ouvrir un notebook Colab et lire un échantillon de données en moins de 10 minutes.

Pré-requis

  • Avoir reçu tes credentials Wasabi par Signal ou WhatsApp (deux chaînes : access_key_id et secret_access_key).
  • Avoir un compte Google (n'importe lequel — perso ou Polytechnique).

Ne jamais coller tes credentials dans un mail, un message public, ni les commiter dans un repo.

Si tu penses qu'elles ont fuité, contacte Emmanuel immédiatement — on les révoque et on t'en regénère.

Étapes

1. Ouvrir Colab

Va sur colab.research.google.com.

2. Importer un notebook depuis GitHub

  • Onglet GitHub
  • Coche "Include private repos" en bas (Google demandera l'autorisation, accepte)
  • Colle l'URL du notebook que tu veux ouvrir, par exemple :
    https://github.com/eserie/maqi-docs/blob/main/notebooks/quickstart-databento.ipynb
    

3. Lancer le notebook

  • Exécute la première cellule (install des dépendances : polars, s3fs, duckdb)
  • Quand la cellule de credentials s'exécute, colle ta access_key_id puis ta secret_access_key dans les prompts qui apparaissent — getpass ne les sauvegarde jamais

4. Lire un échantillon

Le notebook fait ensuite :

import polars as pl

df = pl.read_parquet(
    "s3://maqi-databento-clean/2025/01/*.parquet",
    storage_options={"endpoint_url": "https://s3.eu-central-1.wasabisys.com"},
).head(100)

df

Tu devrais voir un DataFrame de 100 lignes s'afficher.

Si ça ne marche pas

Va voir la FAQ — les erreurs les plus fréquentes (MFA, clé invalide, horloge désynchronisée) sont documentées avec leur fix.