Cadres d’usage des données par des développeurs,  des data scientists et des data journalistes 

Cadres d’usage des données par des développeurs,  des data scientists et des data journalistes 

Porté par Elico (EA 4147), ce livrable n°3 est associé à la tâche D2.3 : « Results of inquiry of  end users’ needs and practices, and usage scenarios ». Il présente les résultats de l’enquête  auprès  des  réutilisateurs  professionnels  des  données  ouvertes,  menée  de  février  à  avril  2017. L’objectif de ce travail a été triple :  réutilisation des données.  Le  livrable  qui  résulte  de  cette  enquête  est  organisé  en  trois  parties.  La  première  décrit  le  contexte  et  présente  l’état  de  l’art  sur  les  réutilisations  des  données  ouvertes.  La  seconde  explicite  la  méthodologie  déployée  dans  la  conduite  de  l’enquête  et  dans  l’analyse  des  résultats. La troisième partie rend compte des résultats de l’enquête en présentant d’abord  les  spécificités  de  données  utilisées  et  en  analysant  ensuite  la  chaîne  de  traitement  de  données  par  des  développeurs,  des  data  scientists  et  des  data  journalistes  interviewés.  Enfin, la synthèse, disponible à la page 41, met en exergue des points à prendre en compte  pour favoriser la réutilisation des données ouvertes par des professionnels des données. disposition  d’informations  mais  également  de  données  ouvertes et réutilisables.  Les  cadres  législatif et administratif de l’open data ont été récemment définis par plusieurs lois1 et par  le Plan d’action national 2015‐20172.

Bien  qu’elle  soit  un  des  éléments  clefs  des  discours  d’accompagnement  de  l’ouverture  des  données,  la  notion  de  réutilisation  reste  mal  définie,  aussi  bien  par  les  acteurs  publics  que  par  les  entreprises  du  numérique  ou  les  chercheurs,  chacun  investissant  cette  notion ouvertes  par  différentes  organisations  privées,  ce  rapport  souligne  l’inadéquation  entre  l’offre  de  données  et  les  jeux  de  données  les  plus  utilisés.  Le  document  appelle  les  administrations  publiques  à  mieux  aligner  l’offre  et  invite  les  entreprises  à  davantage  communiquer autour des réutilisations réussies des données ouvertes.  Les  deux  enquêtes  de  terrain  conduites  dans  le  cadre  de  cette  ANR  ont  cherché  à  comprendre le contexte et les pratiques de réutilisation des données ouvertes. La première  enquête  menée  de  septembre  2015  à  juin  2016  se  focalisait  sur  des  réutilisateurs  des  données liées à la mobilité du portail des données métropolitaines data.grandlyon.com. Les  La  notion  de  cadre  d’usage  qui  est  au  centre  de  ce  livrable  vient  des  travaux  de  Patrice  Flichy ;  il  distingue  un  «  cadre  de  fonctionnement  »,  qui  renvoie  aux  fonctionnalités de  l’objet et à l’usage technique, et un « cadre d’usage », qui se réfère à l’usage social. Les deux chaque  réutilisateur  est  porteur  d’une  histoire  parallèle,  liée  à  son  propre  écosystème  et  à  ses propres finalités que nous tentons de saisir par notre enquête de terrain. Pour ce faire,  nous  avons  décliné  le  cadre  d’usage  en  trois  catégories  que  nous  avons  tentées  de  saisir  à(1995).«  L’action  dans  un  cadre  sociotechnique.  Comment  articuler  technique  et  usage  dans  une  même  analyse?  ».  In :  Les  autoroutes  de  l’information,  un  produit  de  la  convergence,  J.‐G.  Lacroix  et  G.  Tremblay  (Eds.),  Sainte‐Foy,  Presses  de  l’Université  du  Québec,  p.  405‐433 ;  Flichy,  P.  (1995).  L’innovation  technique.  Récents  développements en  sciences  sociales  vers  une nouvelle  théorie  de  l’innovation,  Paris,  La  Découverte ;  Flichy,  P.  (2008).  « Technique,  usage  et  représentations »,  Réseaux,  vol.2,  n°  148‐149),  p.  147‐174.  DOI  :  10.3917/res.148.0147.  URL:  https://www.cairn.info/revue‐reseaux1‐2008‐2‐page‐147.htm;  Flichy,  P.  (2013). « Rendre  visible  l’information. Une  analyse  sociotechnique  du  traitement  des  données », Réseaux,  vol. 2, n° 178‐179, p. 55‐89.

mené  une  série  d’entretiens  semi‐directifs  avec  différents  réutilisateurs  professionnels  des  données  en  portant  une  attention  au  type  de  données  utilisées,  à  la  chaîne  du  traitement  des données, aux outils et aux technologies utilisés, aux spécificités d’utilisation des données  en temps réel et enfin aux différentes modalités d’utilisation des données (ANNEXE 1. GUIDE  D’ENTRETIEN).   De février à avril 2017, V. Dymytrova et V. Larroche ont conduit 26 entretiens semi‐directifs  d’une durée moyenne de 45 minutes ce qui est une gageure avec des professionnels dont le  temps est compté.   Figure 1. Répartition des interviewés par catégorie socio‐professionnelleLes  professionnels  interrogés  ont  été  identifiés  par  deux  moyens :  certains  noms  ou  entreprises  nous  ont  été  suggérés  par  les  interviewés  de  l’enquête  2016,  d’autres  ont  été Parmi  les  personnes  interrogées,  nous  comptons  7  développeurs ;  6  data  scientists/analystes, 6 data journalistes, 3 fournisseurs de portails et 4 personnes‐ressources  le chargé de mission Développement Numérique à la Région Rhône‐Alpes‐Auvergne ; le chef  de  projet  Opendata  de  la  Métropole  de  Grenoble ;  le  chargé  de  mission  Innovation  numérique au Tubà et les fondateurs de la coopérative Datactivi.st (cf. Figure 1). Tous  les  entretiens  ont  été  enregistrés  et  ont  fait  l’objet  de  verbatim.  L’analyse  qualitative  effectuée comprend les codages thématique et axial des propos des interviewés. Par rigueur  scientifique,  les  entretiens  ont  été  anonymisés,  seuls  le  métier  et  le  type  d’organisation/d’entreprise seront ici mentionnés afin de rendre compte de la diversité des  parcours  et  des  situations  des  interviewés,  issus  de  mondes  socio‐professionnels  hétérogènes.

 

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *