Il y a quelques mois, j’ai découvert une vidéo qui combinant deux sujets qui m’intéressent:
- la collecte et l’analyse de données, ma profession
- le réseau Vélib, que j’utilise régulièrement depuis des années
Elle est non seulement très bien réalisée et divertissante, mais m’a aussi permis de me rendre compte que le réseau Vélib avait plus de données disponible que celles en open-data que j’avais déjà regardé dans un billet précédent.
Après être rentré en contact avec le réalisateur de cette vidéo, j’ai pû obtenir et collecter l’état du réseau Vélib toutes les minutes, c’est à dire la liste complète de tous les vélos en station, ainsi que leurs caractéristiques (électrique ou pas, état de marche).
Ce billet va nous plonger dans le fonctionnement du réseau Vélib durant une semaine, celle du 19 septembre 2025 au 26 septembre 2025.
Collecte des données
En utilisant les données d’une API non-documentée utilisée par l’application mobile Vélib, il est possible de récupèrer la position de tous les vélos du réseau en une seule requête. En répétant l’opération toutes les minutes, et avec un algorithme adapté, il est donc possible de calculer les trajets effectués, avec quelques limites:
- la durée des trajets est imprécise: si le trajet dure dans la réalité 2m34s, avec cette technique, il aura duré environ 3 minutes.
- il n’est pas possible de mesurer les “trajets” où le vélo est débloqué puis immédiatement remis en station dans le même dock.
- on ne peut pas discerner un vélo entrant puis sortant du dépôt de maintenance d’un très long trajet
- certains trajets seront concaténés: si quelqu’un met un vélo en station et une autre personne le prend immédiatement, un seul trajet sera comptabilisé
Outils utilisés
Les trajets ainsi obtenus ont été stockés dans un fichier au format Parquet et analysés en utilisant DuckDB et Marimo. Hors mention particulière, les graphiques ont été réalisé à l’aide de la librairie Seaborn.
Nettoyage des données
Pour cet article, nous allons nous devoir exclure certains types de trajets capturés par notre algorithme mais qui ne sont pas de vrais trajets effectués par des utilisateurs Vélib:
- les vélos retirés de la circulation pour aller en maintenance, puis réintroduits plus tard: ces trajets sont anormalement long
- certains trajets anormalement rapides
- les trajets où la station de départ est la même que celle d’arrivée: ces trajets, dits « boomerang », sont indicatifs d’un problème lié au vélo empêchant son utilisation normale
Les seuils utilisés sont les suivants:
- les trajets de moins de une minute sont exclus (souvent liés à des vélos de mauvaise qualité)
- les trajets de plus de deux heures sont exclus (soit maintenance, soit mauvaise attache du vélo en station)
- les trajets dont la vitesse moyenne est supérieure à 30 km/h (les Vélib électriques sont bridés à 25 km/h)
Statistiques générales
Trajets
Durant cette semaine, 1 047 346 trajets ont été mesurés.
En regardant l’emplacement des stations, on peut classer les trajets selon leur itinéraire:

réalisé grâce à sankeymatic.com
Ainsi, pour les trajets non « boomerang »:
- 16.1% sont effectués entre Paris et sa banlieue
- 12.7% sont effectués en dehors de Paris
- 21% sont effectués au sein d’un seul arrondissement parisien
- 50% sont effectués entre deux arrondissements parisiens
Vélos
Durant cette semaine, 23 253 Vélib ont réalisé au moins un trajet:
- 10 418 électriques (45%)
- 12 853 mécaniques (55%)
En regardant le nombre de trajets (excluant les trajets « boomerang »), on peut remarquer une préférence des utilisateurs pour les Vélib électriques:
- 560 235 trajets en électrique (52.6%)
- 504 368 trajets en mécanique (47.4%)
Cette préférence est nettement plus marquée lorsque l’on observe la durée d’utilisation selon le type de vélo:
- 11 419 jours d’utilisation cumulé pour les électriques (61.3%)
- 7 207 jours d’utilisation cumulé pour les mécaniques (38.7%)
Cela nous donne le temps passé par vélo sur la route selon leur type:
- 3h45 mins par jour par vélo électrique (15.6% de temps passé sur la route)
- 1h50 mins par jour par vélo mécanique (8% de temps passé sur la route)
Ces données sont l’une des raisons derrière la récente changement de politique tarifaire de Vélib qui augmente le prix des courses en vélo électrique.
Nos données ayant été collectées après ce changement tarifaire, on observe une sur-utilisation des Vélib électrique (2x plus utilisés que les mécaniques) moindre que celle avancée par l’opérateur Smovengo pour justifier ce changement («[les] modèles électriques, qui représentent 40 % du parc et sont utilisés chacun douze fois par jour en moyenne, trois fois plus que leurs homologues mécaniques»).
Distributions
Pour les graphiques et statistiques qui suivent, les trajets ont été filtrés pour ne retenir que:
- les trajets entre deux stations différentes
- d’une durée supérieure à une minute et inférieure à 1 heure
Cela exclut les trajets « boomerang » ainsi que les trajets trop courts ou long pour être représentatifs de l’usage réel de Vélib.
Durée des trajets


On remarque bien la sur-utilisation des vélib électriques: plus les trajets sont long, plus il y a de chance que l’utilisateur choisisse un vélib électrique pour le réaliser.
Vitesse


Remarque
Pour calculer la vitesse des Vélib, nous nous basons sur la distance à vol d’oiseau entre stations, ce qui n’est pas 100% réaliste.
Une analyse plus fine regarderait la longueur du trajet le plus court entre chaque paire de stations qui utilise des voies praticables par des vélos.
Sans surprise, les vélib électriques sont plus rapides que les mécaniques.
La vitesse moyenne des vélib est de 10.43 km/h:
- 9.65 km/h pour les mécaniques
- 11.14 km/h pour les électriques
Nombre de trajets par vélo

Les Vélib électriques sont bien plus utilisés que les mécaniques. Seuls 70 Vélib mécaniques ont effectué plus de 100 trajets contre 1234 Vélib électriques.
Conclusion
Il y a encore énormément à découvrir de ces données, j’avais été impressionné par l’article de Pierre Auclair sur une classification des quartiers de Paris (affaires, nocturne, résidentiel) en regardant l’usage des stations Vélib qui y sont présentes.
