Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Formation Continue du Supérieur
29 septembre 2012

Enquête nationale sur les archives ouvertes

Début 2012, l'ADBU, Couperin et certains EPST ont lancé une enquête nationale sur les archives ouvertes. Voici l'analyse de ses résultats, un résumé des résultats et les réponses détaillées fournies par les établissements dans la pièce jointe en fin d'article.
Télécharger Results.zip.
Synthèse sur les résultats de l'enquête Archives ouvertes Couperin-ADBU-INRA-INRIA 2012

Enquête menée au premier trimestre 2012 avec l'outil en ligne SurveyMonkey. Elle visait à dresser un panorama des réalisations et des projets d’archives ouvertes de la recherche. Dépouillement réalisé par Jean-Marie Barbiche (ECP), André Dazy (Couperin), Diane le Hénaff (INRA), Jean-François Lutz (Université de Lorraine), Alain Monteil et Claire Büren (INRIA), Christine Ollendorff (ENSAM). Cette synthèse présente des résultats jugés significatifs par l'équipe en charge du dépouillement. Ils sont accompagnés d'éléments d'analyse et de propositions (en gras dans le texte). Lorsque c'était possible et pertinent, des éléments de comparaison ont été établis avec l'enquête menée par Couperin sur le même thème en 2008 (appelée « enquête 2008 » dans la suite de ce document). Certaines questions ont été analysées en fonction du type d'archive ouverte, en distinguant d'un côté les établissements ayant mis en place leur propre système, et de l'autre ceux utilisant HAL ou équivalent (via un portail institutionnel ou pas).
1 Informations institutionnelles

Le nombre de réponses (178 au total, dont 135 questionnaires terminés) est très satisfaisant et les données collectées peuvent être considérées comme représentatives du paysage des archives ouvertes en France, d'autant plus que les EPST ont été nombreux à répondre (19 contre 3 en 2008). Les questionnaires ont été complétés à 92 % par les bibliothèques ou centres de documentation dont l'implication massive sur le sujet est confirmée par la suite de l'enquête.
Les domaines scientifiques couverts par l'archive ouverte sont variés mais les sciences « dures » (citées dans 78% des réponses) sont prédominantes et devancent droit-éco-gestion (52,4%), lettres et sciences humaines (48,6%) et médecine-pharmacie (32,4%).
La dernière question préliminaire portait sur l'étape du projet en cours et sur ce point, la comparaison avec l'enquête de 2008 est éloquente. En 2012, près de 25 % des projets sont en réflexion ou en phase initiale contre 53% en 2008; 50% des archives ouvertes sont en service contre 29 % en 2008. On mesure le chemin parcouru en quatre ans, mais aussi tout ce qu'il reste à accomplir.
→ 50 % d'archives ouvertes en service en 2012, c'est finalement assez peu. Il faudrait analyser pourquoi 15% des répondants n'envisagent « aucun projet » et, en fonction de ces données, mettre en place des outils d'incitation et d'accompagnement.
2 Archives ouvertes inter-établissements

Concernant la structure administrative des archives ouvertes, 80% ne sont pas inter-établissements ce qui reflète à peu près le paysage institutionnel (dans le détail, on compte 23% d'archives interétablissement parmi les projets en cours ou en service depuis 2008, et 17% parmi celles mises en service avant 2008). A quelques exceptions près (notamment les universités en voie de fusion), les établissements semblent enclins à garder la main sur la valorisation de leur recherche plutôt que de la mutualiser au sein d'un PRES.
→ L'entrepôt institutionnel est largement considéré comme faisant partie de l'identité propre de l'établissement, notamment parce qu'il contribue à sa valorisation (voir plus bas). Les projets de regroupements ne sont viables que s'ils correspondent à une réalité administrative visible et pérenne. A ce titre, les regroupements géographiques sont privilégiés car perçus comme plus durables que d'autres entités (PRES, pôles thématiques).
3 Inscription dans un contrat d'établissement.

Si 50 % des projets menés depuis 2008 sont inscrits dans le contrat d’objectif de leur établissement, on observe que les archives institutionnelles propres (non HAL) sont inscrites à plus de 75% dans le contrat d’objectif de leur établissement alors que les archives HAL et thématiques sont bien moins soutenues formellement.
→ HAL nécessite moins d'investissements qu'une archive ouverte propre (serveurs, interface, maintenance...) donc un engagement moins formalisé.
4 Quels sont les objectifs ayant motivé la mise en oeuvre d'une archive ouverte?

Globalement, les objectifs restent similaires à ceux exprimés en 2008: valorisation (de la recherche ou de l'établissement) et création d'une archive patrimoniale sont les plus cités; sans surprise, le peer-reviewing est très peu cité. Pour 20% des réponses, la production d'indicateurs est sans objet, alors même qu'on pourrait s'attendre à ce que ce service soit plus massivement attendu. Ces réponses peuvent être rapprochées des motivations des dépôts: 64% des répondants citent la diffusion et la visibilité des contributions, 21% seulement la fourniture d'indicateurs, qu'ils soient institutionnels ou individuels.
→ Une archive ouverte est avant tout considérée comme un outil de communication, tant au niveau « macro » (établissement) que « micro » (chercheurs). L'hétérogénéité des réponses montre aussi combien les attentes sont diverses d'un établissement à l'autre.
5 Coût humain des projets d'archives ouvertes et profils impliqués dans leur fonctionnement Les équivalents temps-plein dévolus à la mise en place d'une archive ouverte sont difficiles à estimer, et les réponses font état de moyens généralement très faibles (entre 0,5 et 1 ETP en moyenne). Deux profils dominent: bibliothécaires/documentalistes et, dans une moindre mesure, informaticiens, et ce à toutes les phases du projet (de la réflexion initiale au fonctionnement). Lorsque l'archive est en fonctionnement, les services de l'IST et les enseignants chercheurs sont davantage impliqués sans atteindre le niveau des deux premières catégories.
Pour les archives ouvertes en fonctionnement, la comparaison par rapport à 2008 permet d'identifier l'émergence d'un nouvel acteur: le secrétariat, déposant dans 32% des réponses contre moins de 20% en 2008 (les chercheurs sont déposants dans 59% des cas contre 52,3% en 2008). Et même si l'évolution de ces taux est ténue, il semblerait que les bibliothécaires documentalistes, toujours massivement déposants (59%, contre 63% en 2008), se recentrent vers leur coeur de métier (contrôle des métadonnées: 74,4 % contre 59,3 en 2008) au détriment d'autres fonctions qui, du moins nous l'espérons, sont attribuées à des personnels plus spécialisés (modération scientifique: 9% contre 16,3% en 2008, les chercheurs étant passés sur ce rôle de 16,3% en 2008 à 25,6% aujourd'hui).
Dernier point significatif: le rôle de modération juridique est en baisse depuis 2008. Il est attribué majoritairement aux bibliothécaires et documentalistes (23,1% des réponses, 40,7% en 2008), enseignants-chercheurs (7,7% contre 16,3% en 2008), et encore: rôle déclaré chez 9 sur 36 utilisateurs de HAL et 32 sur 34 utilisateurs d'archives institutionnelles.
Sans surprise, une archive institutionnelle propre nécessite plus d'informaticiens par rapport à l'utilisation d'un portail HAL ou assimilé dont la réalisation et le support technique sont en quelque sorte externalisés au CCSD.
Sur les autres fonctions, il n'y a pas de différence flagrante entre les archives propres et les archives liées à HAL.
→ Le rôle massif des bibliothèques et centres de documentation est à mettre en relation avec les difficultés qu'ils rencontrent pour impliquer les chercheurs (question n°10). La solution à ce problème serait de faire participer davantage ces derniers à toutes les étapes, non seulement lors du dépôt (ce qui est déjà largement fait, mais pas partout), mais aussi plus en amont, lors de la (re)définition du projet et de ses objectifs. L'implication croissante des secrétariats dans le dépôt des documents est peut-être conçu comme un palliatif à cette difficulté, le dépôt étant alors considéré comme un travail purement administratif plutôt que faisant partie du métier du chercheur.
Dans le même temps, il faut donner aux bibliothécaires et documentalistes les moyens d'exercer les tâches qu'ils assument (ou pas) autour des archives ouvertes, et en particulier sur les questions juridiques et de droits d'auteur qui préoccupent souvent les chercheurs. Sur ce dernier point, les utilisateurs de HAL se sentent couverts et ne s'investissent pas dans ces questions: il est du ressort de HAL de mieux informer ses utilisateurs sur ce qui leur incombe en la matière.
6 Coûts hors moyens humains

Les coûts de mise en oeuvre d'une archive ouverte hors moyens humains sont relativement marginaux. Le budget communication (affiches, tracts et autres supports) se monte en moyenne à 400 € HT. S'y ajoutent, pour une archive institutionnelle propre, l'achat de matériel informatique (notamment serveurs, à hauteur de 10 000 € HT environ mais avec de fortes disparités). Par comparaison, l'achat de matériel déclaré dans l’enquête se monte en moyenne à 625 € HT pour un portail HAL.
→ Si les situations sont variées, il est manifeste que le recours à un portail HAL nécessite moins de moyens que la mise en place d'une infrastructure propre à un établissement, avec ce qu'elle implique en termes de licence, d'investissement et de maintenance. Il est vraisemblable que le choix des établissements entre ces deux options (HAL ou dépôt propre) soit en partie dicté par des impératifs budgétaires, pas seulement par une véritable réflexion de fond sur les objectifs et les fonctionnalités attendus.
7 Système de dépôt

56% des répondants utilisent HAL (avec ou sans portail établissement), ce qui est beaucoup. En ce qui concerne les archives autres que HAL, le logiciel le plus utilisé est ORI-OAI (44%, 19 réponses) mais seuls 6 de ces établissements déclarent utiliser les web services HAL, 7 n'ont rien mis en place.
→ Il y a sans doute un effort à faire du côté de HAL en matière de communication et de support technique pour accompagner ces établissements et garantir l'interopérabilité entre les archives. La question 5 laisserait pourtant penser que les compétences pour paramétrer ces web services existent la plupart du temps.
8 Intégration dans le système d'information de l'établissement.

Dans une nette majorité de cas (56 %) l’archive est considérée comme peu ou pas intégrée avec le SI de l'établissement. Dans le détail, 75,5 % des déposants dans HAL considèrent le système peu ou pas intégré (et 0% bien intégré!) contre près de 50% des archives ouvertes propres considérées comme bien ou totalement intégrées.
→ Il faut que HAL fournisse des outils et accompagne les établissements pour mieux s'intégrer dans le SI (annuaire Ldap, ENT, exports de données, référentiels...). La gestion des comptes utilisateurs, par exemple, pourrait sans doute être simplifiée et fiabilisée par ce biais.
9 Signalement des archives ouvertes dans les répertoires institutionnels.

Le référencement externe est plutôt faible (40 % seulement des archives sont signalées), et plusieurs personnes ont répondu qu'elles ne savaient pas si leur archive est référencée.
→ Il y a manifestement une méconnaissance de ces répertoires qu'il serait facile de lever en publiant un petit guide récapitulatif décrivant les objectifs, les contraintes et les modalités pratiques pour chacun.
10 Difficultés rencontrées

La comparaison avec l'enquête 2008 montre que la plupart se sont réduites. Le point épineux reste l'implication des chercheurs, plus ou moins difficile pour 83 % des répondants, stable depuis 2008 mais avec une note d'espoir puisque 15 % déclarent que ce point ne pose pas de difficultés contre 6% en 2008.
11 Implication des enseignants et chercheurs et moyens de communication
Interrogés spécifiquement sur l'implication des enseignants et chercheurs, 40% l'estiment en dessous de la moyenne ou faible. Pour les sensibiliser, la communication en face à face est privilégiée.
→ Les difficultés causées par la non-implication des chercheurs aux yeux des bibliothécaires (et il faut rappeler ici que ce sont ces derniers qui ont massivement répondu à l'enquête) restent préoccupantes. Alors que ce sont les premiers concernés, ils ne sont pas encore assez partie prenante des politiques d'établissements en matière d'archives ouvertes (nous y reviendrons). Autre point jugé difficile, la communication institutionnelle. En bref, les archives ouvertes semblent encore trop souvent souffrir d'un déficit d'image. Des recommandations, voire des supports de communication personnalisables, permettraient de partager les bonnes pratiques et de rendre la communication plus efficace. Il faut aussi en renouveler les modes, par exemple en ciblant davantage les décideurs et surtout les enseignants et chercheurs (voir question suivante), que ce soit au niveau local ou national.
12 Politique d'établissement en matière d'archivage

Les pratiques sont variées et dépendent aussi du type de document concerné: les thèses, par exemple, sont souvent soumises à une obligation de dépôt via Star. En schématisant un peu, une archive ouverte institutionnelle propre semble plus propice à une politique d’obligation alors que les établissements utilisant HAL ont plutôt une politique incitative. Cette politique est majoritairement décidée par les directions, peu par les conseils.
→ Ce dernier point explique peut-être les problèmes de communication et de motivation des chercheurs évoqués plus haut. Une solution serait de faire en sorte que ces questions soient davantage traitées au niveau des conseils des universités et, plus globalement, des instances collégiales, pas seulement à la présidence ou la direction des établissements.
13 Prise en charge du libre-accès

Les questions sur la prise en charge des frais de publication dans des revues en open access ont eu peu de succès, preuve que cette question est déconnectée des A-O pour les répondants, et/ou que ce ne sont pas les mêmes qui traitent de ces questions dans les établissements.
14 Utilisation d'un workflow

Dans un établissement répondant sur deux, il existe un workflow de dépôt formalisé; cependant, il existe une forte disparité entre les utilisateurs de HAL ou d'une archive ouverte thématique noninstitutionnelle (33% déclarent un workflow) et ceux qui disposent d'une archive institutionnelle propre (82% en déclarent un).
→ L'utilisation de HAL entraîne des pratiques moins formalisées et une autonomie accrue des déposants, ce qui peut avoir pour conséquence une baisse de la qualité des dépôts (moins de texte intégral). HAL gagnerait sans doute à proposer un workflow paramétrable par établissement (à l'instar de ce qui se fait dans Star), qu'il soit inclus dans l'interface ou proposé indépendamment.
15 Documents déposés

La typologie des documents déposés révèle que les archives ouvertes, surtout lorsqu'elles sont locales, hébergent en majorité des thèses (72% des réponses) et des articles et conférences en pré ou, plus généralement, post-publication. Chez 40% des répondants, aucun type de document n'est explicitement refusé; la même proportion refuse la documentation administrative.
Les dépôts ont cru notablement depuis 2008 (+71%), mais il n'est pas possible d'affiner ce constat car les données recueillies sont insuffisantes (moyennes non significatives, il faudrait les rapporter à la taille des établissements).
16 Dépôts en texte intégral

Cette question révèle une nouvelle ligne de fracture au sein du panel: 80% des archives institutionnelles propres abritent 100% de texte intégral. Pour les archives institutionnelles HAL: 37% en moyenne seulement, avec de très fortes disparités. Un portail HAL incite donc nettement moins au dépôt du texte intégral.
17 Statistiques de téléchargement et autres services

Sur la question de la fourniture de statistiques, l'enquête a récolté très peu de réponses, surtout chez les utilisateurs de HAL. Seuls 16 établissements disposant d’une archive propre y répondent positivement mais là encore, seules dix réponses fournissent des nombres exploitables. Le fait d’avoir une archive institutionnelle propre ne semble donc pas apporter de service de statistique plus performant. C'est pourtant un service essentiel (cité dans les objectifs).
→ Il est indispensable que les archives ouvertes proposent des outils de suivi statistique complets, paramétrables, intuitifs à utiliser et interopérables avec d'autres systèmes (exports), basés sur des critères simples acceptés par tous (nombre de consultation, de téléchargement, etc.)
Concernant les autres services, les réponses sont variées et finalement peu nombreuses. Fait significatif, à la question des services proposés par le système, même les utilisateurs de HAL ne répondent pas pareil: 48% d'entre aux disent proposer des statistiques de consultation globales (52% disent non), 53% disent proposer des statistiques de consultation par chercheur (47% disent non), etc. Il y a donc avant tout un déficit criant de formation des utilisateurs de portails HAL. Pour conclure, il apparaît que l’offre de services des archives ouvertes est proportionnelle à l’âge de l’archive : en général, elle émerge après quelques années de fonctionnement.
→ Il faudrait établir une liste de services indispensables, basés sur des critères consensuels, et donner les moyens aux établissements de les mettre en place. Surtout, il faut communiquer sur les services existants (notamment sur HAL) et les moyens de les utiliser.
Conclusion

Pour conclure, si les progrès sont indéniables depuis 2008, il reste encore du chemin à parcourir pour aboutir à un paysage des archives ouvertes nationales cohérent et homogène basé sur des pratiques et des standards communs. Un point difficile reste l'implication des enseignants et chercheurs, qui devraient pourtant être les premiers concernés par le sujet. Comment progresser à la lumière de ces résultats? Il s'agit entre autres de faire des archives ouvertes un peu moins la chose des documentalistes et un peu plus celle des chercheurs en les impliquant davantage en amont et en prenant en compte leurs attentes en termes de facilités et rapidité de dépôt (3 pages de métadonnées à remplir, c'est trop) et de services associés (statistiques, indicateurs bibliométriques, interopérabilité avec leurs outils, etc.). Beaucoup d'établissements n'ont pas fait de ce sujet une priorité politique, il faut donc communiquer à nouveau vers les présidents et directeurs pour qu'ils saisissent les enjeux et se donnent les moyens de réussir, au service de leur établissement et de la diffusion des savoirs.
Au sujet des réflexions en cours dans le cadre de BSN 4, cette enquête démontre qu'un portail HAL d'établissement est considéré, implicitement ou non, comme une archive ouverte à moindre coût: moins d'investissement initial et moins de maintenance pour un résultat satisfaisant. Résultat, les établissements sont moins regardants sur la qualité des dépôts (peu de workflow, moins de texte intégral) et moins exigeants sur les services associés dont ils ignorent parfois même l'existence. Associer davantage les chefs de projets (souvent des bibliothécaires) en amont, puis proposer un workflow et des services complémentaires simples à utiliser pour les enseignants et chercheurs déposants permettrait qu'ils s'y investissent davantage, au bénéfice de toute la communauté. Plus globalement, la disparité des réponses fait ressortir combien serait utile l'émergence d'un réseau structuré des utilisateurs de HAL au sein duquel les bonnes pratiques pourraient circuler.

Early 2012, ADBU, Couperin and some EPST launched a national survey of open archives. Here the analysis of the results, a summary of the results and the detailed responses provided by the institutions in the attachment at the end of article. More...

Commentaires
Newsletter
51 abonnés
Visiteurs
Depuis la création 2 797 372
Formation Continue du Supérieur
Archives