Open Data

Open Data

Ouvrir les données et après ?


Articles connexes

2e rencontre Opendata/Citélabo du 3 mai à Paris #2 Données privées

Alors que le mouvement d’ouverture des données publiques prend de l’ampleur en France, et que l’Etat (EtaLab / APIE) et plusieurs collectivités se sont lancés dans la bataille, les données privées restent un sujet plus méconnu[1] .
Lors de l’atelier CitéLabo OpenData qui s’est déroulé le 3 mai à la Mairie de Paris, un sous-groupe de travail s’est constitué autour du sujet des données privées, réunissant des acteurs de la Poste, d’Orange, du groupe Suez Environnement, de l’APIE, du groupe Laser...
Tout d’abord qu’entend-on par « données privées » ? Plusieurs cas de figure sont possibles
-    Les données que détiennent les entreprises et qu’elles produisent elles-mêmes ;
-    Les données qu’elles récupèrent de l’acteur public pour les transformer, les traiter, à des fins commerciales, ou pour le compte de l’acteur public ;
-    Les données que des entreprises privées produisent dans le cadre d’une délégation de service public, et qui de ce fait sont de la propriété de l’acteur public.
C’est l’angle « Données publiques / acteurs privés » qui a essentiellement été abordé, et qui est présenté ici.
Je laisse d’ailleurs aux participants le soin de compléter / corriger ses éléments de compte-rendu.

 

A qui appartiennent les données ?

Inexorable question au centre des débats… qui a été l’occasion de rappeler – fortement - que le premier « générateur » de données est l’habitant-citoyen-usager, par ses pratiques, ses usages. L’usager se montre spontanément très attaché à ses « données personnelles »[2]. Tandis qu’il a peu conscience des données que ses usages produisent, et de la valeur de celles-ci (c’est pour ainsi dire la face immergée de l’iceberg). De ce fait il abandonne facilement la propriété de ses données « d’usages ». Il faut dire aussi que la plupart des contrats signés entre les usagers et les opérateurs de services fonctionnent par « opt-out », par le biais d’accord tacite, ou d’accord par défaut, c’est-à-dire ne demandant pas explicitement aux usagers s’ils souhaitent reprendre possession de leurs données. Sur le net, il existe certaines pratiques « d’opt-in » où l’accord de l’usager est expressément demandé et formulé, mais de façon intégrée au process d’utilisation d’un service, d’un logiciel. L’internaute, pressé, n’y attache pas toujours l’attention qu’il faudrait (ex : accepter les termes d’un contrat à l’ouverture d’une application, d’un service en ligne).

 

image

 

Certaines pratiques de « crowdsourcing » proposent, elles, à l’internaute, de livrer des données personnelles en contrepartie de la création d’un service / d’une information sur-mesure).

 

Des données personnelles individuelles aux données personnelles « massifiées »

La valeur des données d’usages vient de leur « massification ». Un opérateur de téléphonie mobile, par exemple, récolte des données individuelles d’usage de la téléphonie, données qui, assemblées, deviennent des « données collectives », des « données personnelles massifiées ». Il y a de « l’intelligence » à tirer de ces données produites par l’usage d’un service / d’un produit, mais cela peut-il se faire sans les personnes concernées ? Les usagers ont-ils un droit de regard sur ces data collectives ? Par ailleurs, l’anonymisation des jeux de données, quand ceux-ci sont réutilisés, est une condition nécessaire, mais pas toujours suffisante. Car le croisement de données peut conduire à la reconstitution de données personnelles individuelles.

 

image

 

Entre droit de propriété et droit d’usage des données, le cas des délégations de service public

 

Certains producteurs/récolteurs de données « personnelles massifiées » le font dans le cadre d’une activité liée à une délégation de service public –DSP-, ce qui complexifie les approches d’OpenData. En effet aux questions de propriété des données s’ajoute un droit de propriété intellectuelle des bases de données (« sui generis »), qui nécessite de savoir si la base de données a été produite dans le cadre de la DSP ou pas ? Or la majorité des contrats signés entre les collectivités et les entreprises délégataires, souvent plusieurs années auparavant, ne prend pas en compte cette dimension-là. Pour Suez Environnement, ce sont plus d’un millier de contrats qui sont concernés et selon lesquels la propriété des données peut varier. Passer en revue les types de contrats existants, et en faire ressortir les possibilités actuelles – c’est-à-dire ce qui est d’ores et déjà possible, sans réaliser d’avenant au contrat – permettrait de tirer de premiers enseignements.

Mais le flou juridique actuel ne constitue pas pour autant un frein à l’action et à la réutilisation. Certaines entreprises délégataires se sont révélées être force de propositions auprès de leurs collectivités clientes. C’est le cas de l’opérateur de transport Kéolis, à Rennes, ayant incité l’agglomération de Rennes à aller de l’avant et à lancer le concours « Rennes Métropole en accès libre ».

Cela met en exergue l’importance du droit d’usage des données, en parallèle de celle du droit de propriété.

 

La génération de revenus

L’exploitation et la réutilisation de données par des entreprises privées sont-elles génératrices de revenus, et de revenus conséquents ? Les exemples que l’on peut trouver sont encore à la marge, et viennent essentiellement de l’économie numérique. Ils dessinent des modèles extrêmement différents selon :

  • la nature des données « chaudes » « froides » : c’est-à-dire des données d’actualité qui seraient payantes, tandis que les données anciennes seraient gratuites, ou le contraire, comme le modèle actuel de la Presse (accès payant aux archives).
  • la monétisation des données : - directe ou indirecte [3]: c’est le cas de l’économie de l’attention (Google), des moteurs de recherche (moteur de recherche de logement Nestoria ) - ouverte et payante, ou ouverte et gratuite... Même en étant gratuites les API peuvent générer des revenus (c’est le modèle mixte de Google [4] ). - des revenus de e-commerce partagé (conseiller à certaines internautes des lectures en fonction de son profil, ses centres d’intérêts, et partager les revenus de l’achat du livre le cas échéant). Cela peut passer aussi par des modèles dits « d’économie de l’attention » (à partir des données de profils, de l’analyse des usages, capter l’attention de l’internaute et lui proposer des services contextuels, thématiques), des modèles « pure image » (bénéfice d’images « avec rebond »), des modèles de recommandation (augmenter le taux de transformation…), etc.

Ces modèles ne décrivent pas des modèles « uniques », sur lesquels pourrait se fonder toute une activité. Ils sont plutôt des compléments à une activité donnée – compléments non négligeables et dont la part relative tend à augmenter. Pour le groupe la Poste, par exemple, la réutilisation et l’exploitation des fichiers d’adresses postales pourrait générer un chiffre d’affaires de l’ordre de 1/10 du chiffre d’affaire global, soit un revenu pas si important que d’autres activités de la Poste, mais pas non plus négligeable...

 

Générer des idées de partage de données

De la même façon que les collectivités, les entreprises disposent de données, mais ne savent pas toujours comment les traiter, ou lesquels réutiliser. Quelles données seraient intéressantes à libérer ? Lesquelles seraient créatrices de valeurs ? Comment un consortium d’entreprises, autour et avec un territoire, peut mettre en oeuvre une démarche d'OpenData ?

Autant de questions qui feront l’objet des différentes rencontres prévues par le groupe de travail d’ici décembre 2011, avec plusieurs objectifs :

  • approfondir la problématique du droit d’usages des données,
  • identifier et illustrer la création de valeur et les modèles économiques sous-jacents.
  • construire une sorte de cahier des charges de l’OpenData à destination des acteurs privés, en les aiguillant dans leur démarche d’ouverture et de réutilisation des données.

 

Prochaine réunion du groupe de travail lors de l'Open Data Garage, à Marseille, le 6 juillet prochain

 


[1] Méconnu, mais pas neuf pour autant ! Notons que le GFII (groupement français de l’industrie de l’information) accompagne depuis les années 80 les entreprises dans le développement des bases de données professionnelles

[2] même si l’observation des pratiques révèle une réalité parfois toute autre : certains internautes ayant une propension très forte à « l’exposition de soi » sur le net, sans précaution aucune…


Vous devez vous identifier pour ajouter un commentaire.
Veuillez vous identifier, ou créer un compte.

Conception & réalisation : Facyla ~ Items International

Plateforme construite avec le framework opensource Elgg 1.8