Quickstart Colab¶
Objectif : ouvrir un notebook Colab et lire un échantillon de données en moins de 10 minutes.
Pré-requis¶
- Avoir reçu tes credentials Wasabi par Signal ou WhatsApp (deux chaînes :
access_key_idetsecret_access_key). - Avoir un compte Google (n'importe lequel — perso ou Polytechnique).
Ne jamais coller tes credentials dans un mail, un message public, ni les commiter dans un repo.
Si tu penses qu'elles ont fuité, contacte Emmanuel immédiatement — on les révoque et on t'en regénère.
Étapes¶
1. Ouvrir Colab¶
Va sur colab.research.google.com.
2. Importer un notebook depuis GitHub¶
- Onglet GitHub
- Coche "Include private repos" en bas (Google demandera l'autorisation, accepte)
- Colle l'URL du notebook que tu veux ouvrir, par exemple :
3. Lancer le notebook¶
- Exécute la première cellule (install des dépendances :
polars,s3fs,duckdb) - Quand la cellule de credentials s'exécute, colle ta
access_key_idpuis tasecret_access_keydans les prompts qui apparaissent —getpassne les sauvegarde jamais
4. Lire un échantillon¶
Le notebook fait ensuite :
import polars as pl
df = pl.read_parquet(
"s3://maqi-databento-clean/2025/01/*.parquet",
storage_options={"endpoint_url": "https://s3.eu-central-1.wasabisys.com"},
).head(100)
df
Tu devrais voir un DataFrame de 100 lignes s'afficher.
Si ça ne marche pas¶
Va voir la FAQ — les erreurs les plus fréquentes (MFA, clé invalide, horloge désynchronisée) sont documentées avec leur fix.