Ouvrir ses données en transport : comprendre les enjeux pour définir une stratégie

Ouvrir ses données en transport : comprendre les enjeux pour définir une stratégie

Par Sybille Berjoan, directrice Monde des Etudes Transports Accenture Research, Paris et Catherine Bouteiller, doctorante au Laboratoire d'Economie des Transports, Lyon

Qu'advient-il des données ouvertes (open data) en transport urbain ? Quelles sont les différentes réutilisations possibles de ces données ? La donnée doit-elle être gratuite ? Ce sont autant de questions que se posent régulièrement les autorités organisatrices de transport (AOT) et opérateurs. Chacun suivra une stratégie en fonction de ses possibilités en matière d'animation d'un réseau d'utilisateurs comme à Rennes, ou de sa capacité à participer à des projets de recherche d'envergure comme à Lyon, voire à revendre de la donnée retraitée comme à Paris. Issues pour certaines de l'open data, les applications grand public de calcul d'itinéraire sont devenues aujourd'hui un standard dans les principaux réseaux de transport public. Ces outils sont réalisés soit en interne, soit par des tiers grâce à la donnée brute mise à disposition. Par ailleurs il n'est plus rare que les outils d'aide à la décision opérationnelle des exploitants de service de transport utilisent de la donnée ouverte comme des données de météorologie. Cet article a pour objet de donner quelques clefs pour mieux comprendre comment les données en transports peuvent générer de la valeur et quelles sont les principales stratégies suivies par les AOT ou les opérateurs pour ouvrir leurs données transports.
Quelles sont les données concernées dans les transports ?

Le phénomène de l'ouverture des données a commencé en Angleterre et aux Etats-Unis dans les années 2010. En France, l'idée de la mise à disposition des données publiques n'est pas nouvelle puisque, par la loi du 17 juillet 1978, toute personne a un droit d'accès aux documents administratifs et un droit à la réutilisation des données publiques non nominatives. La Directive européenne 2003/98/CE et celle du Conseil du 14 novembre 2003 concernant la réutilisation des données a été transposée en France à travers l'Ordonnance 2005/650 du 6 juin 2005 et le Décret 2005/1755 du 30 décembre 2005.

En matière de transport, les données ouvertes sont relatives à la mobilité, c'est-à-dire à l'activité bus, métro, train mais également à la voirie, et au trafic routier et autoroutier, aux vélos et enfin aux piétons : quatre grandes familles de données ont été recensées.

Les données les plus recherchées par les utilisateurs, individuels ou entreprises sont les données en temps réel. Ce sont celles qui nécessitent une maintenance particulière pour assurer un flux d'approvisionnement garantissant une continuité de l'information, une qualité et une exhaustivité. Les données descriptives ou géolocalisées sont plus facilement disponibles. Elles nécessitent une exactitude et, là encore, une mise à jour régulière : tracés des lignes régulières de transport, localisation à jour des arrêts…
Quelles sont les utilisations possibles des données ouvertes ?

Que faire de ses données et pour quels bénéfices ? Au-delà du foisonnement des applications grand public pour smartphones combinant informations de transport, flux en temps réel et publicité pour des commerces de proximité, il faut revenir en détail sur deux grands champs d'application des données combinées.

La donnée retraitée a une valeur opérationnelle directe : l'exemple des postes de commandement
Application en interne des données en temps réel. Ici, le Centre de contrôle et de surveillance automatique du trafic de Los Angeles.Application en interne des données en temps réel. Ici, le Centre de contrôle et de surveillance automatique du trafic de Los Angeles.

La combinaison de différentes sources de données collectées en open data peut avoir une valeur opérationnelle directe pour le pilotage du réseau de transport. C'est déjà ce que proposent les outils d'analyse en temps réels des flux, lorsqu'ils intègrent la météorologie et les informations sociales. Ces outils, largement utilisés pour le pilotage des feux et la gestion de la voirie, permettent une meilleure réactivité des opérateurs et des secours, le cas échéant. On peut noter de nombreux projets de création de centres de contrôle opérationnels en partenariat avec des entreprises privées. Ce type de projet doit être porté et coordonné par tous les acteurs présents en voirie. Si l'intérêt opérationnel l'emporte, on peut cependant noter des contradictions et d'éventuels conflits avec la présence de plusieurs postes de commandement : autoroutier, pompiers, opérateurs de transport, centrales routières privées.

Les données combinées peuvent avoir une donnée stratégique prédictive valorisable

La multiplicité des données disponibles potentielles, nous oblige à changer d'échelle et à penser le système de transport au sein du pilotage de la ville. Il ne s'agit plus tant de piloter un réseau de transport que de comprendre et d'orienter des flux urbains motivés par différents objectifs. La plupart des projets big data (données massives) au niveau des villes s'inscrivent dans cette démarche d'intégration des informations d'usage, de consommation électrique, de mobilité, le tout dans un contexte géographique et climatique donné.

Les laboratoires de recherches explorent les données et tentent de mettre en place des plateformes innovantes d'analyse : peu de collectivités ont investi aux côtés des laboratoires et des industriels pour faire aboutir des projets. Deux initiatives méritent d'être citées.

1. Le projet lyonnais Optimod : la prédiction du trafic à 1 heure

Le Grand Lyon, en étant partie prenante du projet Optimod, participe directement, aux côtés de 6 autres intervenants de la sphère universitaire et privée, à la création d'une application grand public et d'un navigateur pour le fret urbain. Ce projet réalisé à partir de données transverses incluant bus, métro, train, vélo, route, autopartage, covoiturage, parking devrait permettre de prévoir le trafic routier à 1 heure. Il s'agira, à terme, d'un navigateur multimodal temps réel proposant des changements d'itinéraire sur plusieurs modes. Par ailleurs, le projet intègre la mise à jour de l'information nécessaire au gestionnaire des feux en voirie. Dans cet exemple, une collectivité a fait le choix d'investir aux côtés de partenaires multiples, pour utiliser ses propres données et celles d'autres autorités organisatrices, et ainsi produire des services à valeur ajoutée pour le compte du public et pour des entreprises privées. Dans ce cas, la valeur est bien partagée entre un outil logiciel de pilotage de flux, une application client et enfin un logiciel embarqué pour les camions de livraison. Pour l'industriel en charge de l'élaboration de la prédiction à 1 heure, la création de valeur est claire. Pour la collectivité qui met à disposition une application pour ses utilisateurs individuels mais aussi pour les professionnels en charge de la livraison en ville, le bénéfice en termes d'image et d'efficacité en matière de réalisation de politique publique de désengorgement peut être quantifiable. Certes, le partenariat inclut un partenaire privé informatique renommé pour le calculateur de la prédiction à 1 heure, mais la plateforme des données ouvertes restera la propriété du Grand Lyon.

2. La plateforme universitaire Live Singapore, projet du MIT

Le « senseable City Lab » hébergé au Massachussetts Institute of Technology, est à l'origine de plusieurs projets de traitement de flux de données urbains en temps réel. Dans le cas du projet live Singapore, la recherche a été menée par Smart (Singapore-MIT Alliance for Research and Technology). La réalisation d'une plateforme capable de traiter en temps réel des données très diverses sur la population, la mobilité et les comportements dans la ville doit permettre aux autorités, comme au citoyen, d'inventer les usages de demain. La plateforme restitue visuellement des informations en temps réel sur les mouvements de foule, les déplacements des 16 000 taxis, les passagers de compagnies aériennes, les conditions microclimatiques, la consommation d'électricité sur l'île, les mouvements de conteneurs maritimes dans le port de transit. Les données du projet ont été divisées en 3 catégories :

• les données produites par l'industrie,

• les données collectées via des tags et des capteurs,

• et enfin la donnée partagée par les utilisateurs.

La grille de lecture de ces données est extrêmement complexe. La plateforme ne stocke aucune donnée mais se propose d'analyser les flux simultanés pour leur donner un sens.
Intégration d'applications au site open data de l'autorité organisatrice Land Transport Authority (LTA) de Singapour.Intégration d'applications au site open data de l'autorité organisatrice Land Transport Authority (LTA) de Singapour.

Les limites du projet Live Singapore sont de deux ordres : comment garantir que la donnée reste anonymisée tout en permettant une analyse assez fine pour que l'utilisateur final puisse en tirer bénéfice à titre individuel. Par ailleurs comment convaincre des partenaires, publics comme privés, que la valeur de l'analyse globale des données repose sur la multiplicité des sources d'alimentation en données désagrégées. Si des flux de données ne sont pas collectés, tout l'intérêt de la confrontation des données entre elles est perdu. Or chacun des pourvoyeurs individuels cherche à connaître le bénéfice et la valeur qu'il peut retirer de sa donnée, alors que c'est collectivement que la donnée prend sa valeur.

Quelles sont les stratégies suivies aujourd'hui par les AOT ?

Le retour d'expérience Etalab (2011) met en évidence le foisonnement d'acteurs pouvant utiliser les données : chercheurs, journalistes, développeurs, entreprises privées développant des applications pour le grand public, mais également sociétés privées désireuses de faire du géomarketing ou collectivités, pour de l'aide à l'exploitation. Simon Chignard (2012) a défini 4 classes de réutilisation : la « consultation des données », la « réalisation d'applications », la « médiation » qui n'est autre que la représentation de la donnée brute, et la « réutilisation spécialisée » en business to business.

Il existe 3 profils d'AOT face à ce foisonnement d'acteurs

Les AOT qui ouvrent les données brutes sans condition pour faciliter les apports externes

Ces dernières font confiance au marché pour produire de la valeur en délivrant une donnée brute non traitée : cette donnée est multiple, toutes catégories, tous modes : c'est le cas de Londres avec TFL (Transport for London) et de NYC avec MTA (Metropolitan Transportation Authority). La donnée est disponible, facilement accessible, non traitée, libre d'accès et de droit : la « médiation » n'est pas aisée car elle nécessite une manipulation par l'utilisateur.

Ce dernier est néanmoins libre de pouvoir réutiliser cette donnée et de créer de la valeur dont il récupère les profits. Dans ce type de ville on peut observer un foisonnement d'applications grand public dont le standard est le calculateur d'itinéraire avec horaires réels.

L'AOT bénéficie indirectement des retombées positives en termes de modernité et de facilité d'usage du réseau.

Les AOT qui ouvrent partiellement leurs données et produisent de la valeur en interne
Visualisation de données d'activité transport avec le logiciel Carte et données.Visualisation de données d'activité transport avec le logiciel Carte et données.Photo : SP

Ces dernières traitent une partie de leurs données en produisant elles-même un certain nombre d'applications de visualisation et de médiation (figure 2). Elles ne mettent à la disposition du public qu'une partie de la donnée brute : c'est le cas de Singapour avec LTA (Land Transport Authority) qui a produit en interne des applications et a intégré à son site un service de conciergerie. Une partie de la valeur créée est récupérée par celui qui produit la donnée, c'est-à-dire l'autorité organisatrice. Celle-ci choisit néanmoins de mettre à disposition un certain nombre de données en temps réel, notamment celles relatives au trafic routier. L'autorité organisatrice n'a pas forcément toutes les compétences en interne pour explorer tous les champs d'applications possibles et se heurte à des limites en termes de recrutement de profils spécialisés et de développement de compétences dans tous les domaines de la mobilité.

Les AOT qui cherchent un positionnement en vendant une donnée déjà transformée

Celles-ci hésitent à mettre à disposition la donnée par crainte de voir une partie de la valeur potentielle de cette donnée leur échapper. Pour autant, elles hésitent également à mettre en œuvre les investissements qui pourraient potentiellement amener à récupérer une partie de cette valeur. Faut-il retraiter la donnée, investir dans du développement ? Dans quel type de projet investir et est-ce encore du domaine de compétence d'une autorité organisatrice ?
L'application Urbanpulse ne peut couvrir tous les modes avec la même qualité d'information.L'application Urbanpulse ne peut couvrir tous les modes avec la même qualité d'information.

Le Stif n'a pas mis à disposition du grand public les données temps réel. Pour autant le Syndicat mixte des transports d'Ile-de-France revend du service par le biais de licence et d'une tarification à l'usage pour le téléchargement par des opérateurs privés de calculs d'itinéraires. C'est ainsi que Mappy, acteur privé de cartographie et de services géolocalisés, achète des calculs d'itinéraire au Stif. Les potentiels sont limités car aujourd'hui, le calcul d'itinéraire est devenu un standard et la donnée temps réel prend toute sa valeur quand elle est intégrée. Par ailleurs la RATP n'a pas mis à disposition les horaires de bus en temps réel mais a développé sa propre application RATP Premium pour délivrer l'information en temps réel sur les horaires de passage et le trafic. Certes, certains opérateurs comme Transdev ont mis sur le marché des applications utilisant des informations de leur réseau en temps réel, puisqu'elle disposait en interne de la donnée. Cependant, une application comme Urbanpulse (ci-contre), ne peut couvrir tous les modes avec la même qualité d'information et de service par manque de disponibilité de la donnée sur les autres réseaux. Le calcul d'itinéraire en temps réel est parfois incomplet alors que ce service est un plus, pour cette application qui se propose de mettre en relation un utilisateur avec des activités marchandes.
Quels investissements ?

L'animation du réseau

Tous les spécialistes de l'open data sont unanimes sur le fait que l'ouverture des données nécessite un accompagnement fort et une animation du réseau d'utilisateurs potentiels. A Nantes, Libertic est une association de promotion de l'ouverture des données publiques qui est présente depuis 2010. A Rennes, d'octobre 2010 à mars 2011, un concours a permis de fédérer les initiatives. Le 22 février 2014, l'Open data day 2014 a été l'occasion de fédérer les utilisateurs dans 140 sites géographiques différents du monde dont 4 seulement en France (Nantes, Paris, Lille, Tours). Ces journées d'animation sont l'occasion de hackathons permettant à des développeurs, des designers, mais également des entrepreneurs et des chercheurs de se rassembler pour créer des prototypes et faire émerger collectivement des exemples de réutilisation. Dans le même temps, c'était 20 villes qui organisaient le même jour, l'Open data day en Italie, 7 en Allemagne, 8 en Espagne, 10 en Suède, le Japon étant le plus actif avec 32 villes organisatrices.

Les licences

Il est impératif de connaître les différentes formes de licences ouvertes telles que définies par l'Open Know-ledge Foundation, association à but non lucratif créée à Cambridge en mai 2004 : licences PDDL (Public Domain Dedi-cation and License), ODC-BY (open data Commons Attribution License), ODbL (open data base Licence).

La mise à disposition des données publiques en France est régie par un cadre légal strict qui s'appuie essentiellement sur les licences OdBL et la licence ouverte Etalab 2012 .

Les différents cadres juridiques possibles doivent être soigneusement étudiés en fonction de la stratégie choisie par l'autorité organisatrice ou l'opérateur. Les données peuvent être mises à disposition soit en libre accès direct comme sur le site mytransport.sg de Singapour .

Mais certaines données plus sensibles comme les images des caméras de surveillances des autoroutes en temps réel peuvent faire l'objet d'un accord signé à travers un protocole. Ainsi sur le même site de mytransport.sg, un questionnaire sera à renseigner et une charte à signer pour obtenir la donnée intitulée « Webcam images along expressways and Woodlands & Tuas Checkpoints » avec des droits de réutilisation restreints.

Quel retour sur investissement ?

Les éléments sur les retours sur investissement des stratégies d'open data sont plutôt très partiels et quasiment inexistants en transport. On notera cependant plusieurs études avancées dans la presse. Selon le rapport « the value of Danish data 2010 » l'autorité responsable des noms de rues et adresses au Danemark a évalué des bénéfices financiers de l'ouverture gratuite des données à 62 millions d'euros, 48 créations d'entreprises et 90 emplois. Le budget nécessaire au service, le coût unitaire de la donnée, le personnel nécessaire à la gestion de la donnée en interne ont fortement diminué. Pour Rennes, la donnée ouverte aurait généré près de 47 applications que la collectivité n'aurait pas pu financer si elle avait dû les mettre en œuvre. Dans le même temps la collectivité aurait investi 20 000 € pour la mise à disposition de la donnée et évalué à 25 % la charge de travail supplémentaire ponctuelle pour les services concernés au lancement du projet.

La mise en œuvre d'une stratégie d'open data nécessite, a minima, de prendre en compte le coût de la structure informatique, le coût salarial et de formation des personnels qui devront mettre à jour la donnée sur le site et le coût des animations et concours autour des données. Faut-il évaluer les bénéfices en termes de nombre d'applications créées par des tiers ? Mais alors, comment tenir compte de la redondance des applications comme c'est le cas pour les applications cartographiques et touristiques réalisées en surnombre à partir de données de localisation géographique. Comment chiffrer l'impact en termes d'image pour la collectivité et d'attractivité pour des usagers et les entrepreneurs ?
Conclusion

Le foisonnement possible des données, mais surtout la possibilité de les traiter en combinaison avec d'autres informations collectées à travers différents canaux laisse entrevoir différents leviers d'action. Les données de mobilité, comme les informations d'ordre démographique, météorologique, statistique, une fois combinées et retraitées, permettent d'envisager des applications diverses de prédiction de la demande, d'orientation et de production en temps réel, de retour d'expérience. D'autres applications par le grand public restent à inventer : quels usages feront les utilisateurs d'outils leur permettant de combiner en temps réel des données par ailleurs disponibles de manière dispersée, dans quelle mesure l'anonymisation des données et leur usage pourront-t-ils être garantis ? Pour mettre en œuvre ces projets, des compétences variées sont nécessaires : recherche opérationnelle, géomarketing, design et ergonomie, et bien sûr traitement informatique analytique. Ces projets ne peuvent voir le jour sans une forte implication des acteurs avec une gouvernance forte ou une volonté de travailler en mode projet. Comment produire du service et participer à la création de valeur grâce à l'open data ? La clef est certainement dans une démarche très fortement intégrée entre acteurs. Mais ce type de projets reste encore assez rare. L'usage de l'open data, in fine, pourrait reposer le problème de la gouvernance des projets de mobilité dans un contexte de morcellement de la compétence transport.

Ajouter un commentaire
Code incorrect ! Essayez à nouveau