L’ouverture des codes sources pour un enseignement supérieur et une recherche publique fiable

L’ouverture des codes sources pour un enseignement supérieur et une recherche publique fiable

Le cadre légal applicable aux établissements de l’ESR

Les instituts de l’ESR sont soumis à un cadre légal favorable à l’open source : • en tant qu’administration : tout logiciel, en tant que document produit ou reçu par un acteur de l’ESR dans le cadre de ses missions de service public de recherche, est soumis par principe au régime de l’open data. En effet, depuis la loi « Valter » de 2015, les centres de recherche ne peuvent plus appliquer leurs propres conditions de réutilisation des documents administratifs. Ils sont ainsi pleinement soumis au régime général de l’open data revu par la Loi pour une République numérique (LPRN) de 2016 qui a étendu le champ d’application de l’open data aux codes sources. Dès lors, la diffusion des codes sources devra se faire sous une licence open source et dans un standard ouvert, sans que des restrictions techniques ou juridiques puissent entraver son accès, sa modification, son analyse et sa redistribution. Audelà de l’application du régime standard de l’« open data à la demande », les logiciels entrent dans la catégorie dite de l’« open data par principe » (ou par défaut) en tant que données « dont la publication présente un intérêt économique, social, sanitaire ou environnemental33 » – ce qui impose un comportement proactif d’ouverture et de diffusion ; • en tant qu’acteur de l’ESR : la loi n° 2013-660 du 22 juillet 2013 relative à l’enseignement supérieur et à la recherche dispose par ailleurs que les « logiciels libres sont utilisés en priorité » (codifié en l’article L. 123-4-1 du code de l’éducation) par le service public de l’enseignement supérieur dans la mise à disposition de « services et des ressources pédagogiques numériques ». Ces dispositions ont été prévues afin de favoriser une mutualisation dans le financement, l’achat et l’utilisation de logiciels au bénéfice des acteurs de l’enseignement supérieur et de la recherche.Néanmoins, il semblerait que l’absence de sanction et de recours administratifs entraîne une faible application du cadre prévu par le législateur . À noter qu’au niveau juridique, les licences open source CeCILL (CeCILL, CeCILL-B et CeCILLC) ont été rédigées par le CNRS, le CEA et l’INRIA pour disposer de licences compatibles avec le droit français (face à un paysage open source majoritairement nord-américain) et, ainsi, sécuriser et accompagner les pratiques de l’open source au sein des centres de recherche. Ces licences ne sont aujourd’hui plus portées politiquement et humainement, rendant les chercheurs ou chargés de valorisation démunis devant ce choix, préjudiciant aux objectifs initiaux. Un des chercheurs interrogés36 notait qu’il avait utilisé les licences CeCILL mais avait arrêté, car « cela posait problème avec l’international ». D’autres pays, telle l’Allemagne, ont aussi historiquement produit leur propre licence, aujourd’hui abandonnée au profit des licences open source qui sont devenues des standards de fait. On peut noter aussi l’existence de la licence EUPL37, qui ne figure pas néanmoins dans les licences autorisées au sein de l’administration française.

Science ouverte, reproductibilité et intégrité scientifique

L’ouverture des codes sources rejoint une problématique majeure au sein de la recherche qui concerne la qualité des savoirs produits et des modalités d’évaluation de la recherche tout autant que de son personnel (enseignant.e.s-chercheur.e.s, etc.). À ce propos, ont été cités également plusieurs fois en commentaires des entretiens et du questionnaire, l’enjeu de la reproductibilité en sciences nécessitant l’ouverture du « code scientifique » tout autant que des formations un système de reconnaissance et d’évaluation prenant en considération ces nouvelles pratiques.Ce point rejoint de façon plus globale les initiatives actuelles à l’échelle internationale, européenne et nationale de science ouverte (open access, plan de gestion des données, principes FAIR) soulignée notamment par la note d’opportunité du CoSo sur la valorisation des logiciels issus de la recherche. La publication du code source représente en ce sens une des briques du travail scientifique à partager afin de pouvoir tracer l’ensemble de la démarche scientifique : • ces codes sources ici ne sont pas produits dans une optique de production logicielle ou de valorisation, c’est-à-dire dans le but de développer un outil utile à un grand nombre et qui a vocation d’être maintenu ; • ces codes sources « bouts de code », « scripts », « petits projets », « pipeline de données », comme le rappellent certains commentaires et remarques de personnes interrogées, sont néanmoins la traduction en langage de programmation d’algorithmes nécessaires au traitement, à l’analyse et à la visualisation de données pour la production des résultats et des figures associées aux publications scientifiques40 . Bien qu’associée à la notion juridique de logiciels41, cette distinction est importante à souligner car elle permet de mettre l’accent sur différents publics concernés par la production, diffusion et utilisation de ces éléments. En effet, ces « scripts » et « codes scientifiques » sont des noms usuels employés par les personnes les produisant (chercheurs, doctorants, etc.) dont les connaissances de développement « logiciels » sont différents d’ingénieurs dont le développement est le cœur de métier. Des journaux scientifiques demandent désormais la publication du codesource (et également des jeux de données) qui ont servi à la production de résultats de recherche42. C’est le cas par exemple du journal IPOL43 qui se présente comme un « Open Science and Reproducible Research journal ». L’objectif est de souligner l’importance des mathématiques comme source pour le design algorithmique et la reproductibilité en recherche. La revue ReScience, quant à elle encourage la réplication de travaux déjà publiés et promeut de « nouvelles implémentations en open source afin de s’assurer que les travaux originaux soient reproductibles ».En effet un de ses fondateurs en entretien46 note que les enjeux de reproductibilité nécessitent d’une part d’ouvrir les codes sources, mais également de s’assurer que l’environnement de travail disponible à ce moment puisse être retrouvé, et cela même 10 ans après. Cela implique ainsi des questionnements transverses sur le référencement et l’archivage et la constitution d’un patrimoine logiciel dont Software Heritage47 est une des initiatives clefs. 

Formation et coursTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *