Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Formation Continue du Supérieur
31 mai 2017

DIST - Ressources de scientométrie - 1. Logiciels et outils

http://www.cnrs.fr/dist/z-outils/images/charte/logo-cnrs.gifAnalyse bibliométrique et scientométrique

  • Bibexcel est un logiciel gratuit créé par Olle Persson qui permet de convertir des données bibliographiques textuelles en fichiers de données importables sur un logiciel tableur (tel que Excel) afin y être analysées.
  • CiteSpace est un logiciel gratuit en Java utile pour visualiser et analyser les formes et tendances de la littérature scientifique. Sa source primaire de données est ISI Web of Science (WoS), mais également PubMed, arXiv, ADS, et NSF Award Abstracts. Il peut être utilisé pour générer des cartes dans Google Earth, basées sur la localisation géographique des auteurs.
  • CitNetExplorer est un logiciel gratuit en Java développé par l’Université de Leiden pour visualiser et analyser les réseaux de citations de publications scientifiques. Il permet d’importer directement des réseaux de citations depuis la base de données Web of Science.
  • Publish or Perish est un logiciel qui récupère des citations bibliographiques dans Google Scholar puis calcule le nombre de citations par article, par auteur et par année ainsi que l’indice h, l’indice g et d’autres indices bibliométriques.
  • SAINT (Science Assessment Integrated Network Toolkit) est un logiciel open source pour l’analyse scientométrique. C’est l’un des rares outils permettant de convertir des données initialement en format ISI (Thompson Scientific/Institute for Scientific Information, utilisé dans Web of Science), en base de données relationnelle (en format dbm, accdb ou sql).
  • VOSviewer est un programme de cartographie et d’analyse bibliométrique en Java développé par l’Université de Leiden, qui permet d’analyser et de visualiser des réseaux de publications, suivant des mots-clés, citations, co-auteurs et institutions.

Analyse et visualisation des réseaux

Exemples de représentation de réseaux
sous licence Creative Commons

 

Cytoscape
Gephi
NetDraw
NodeXL
  • CFinder est un logiciel gratuit, basé sur la méthode Clique Percolation (CPM), permettant de trouver et de visualiser des groupes de nœuds plus densément connectés les uns aux autres dans un réseau.
  • Cytoscape est un logiciel gratuit et open source en Java. Originellement dédié à la recherche en bio-informatique, Cytoscape est désormais une plateforme généraliste pour l’analyse et la visualisation de réseaux complexes, y compris des multigraphes ou les réseaux multiniveaux.
  • Gephi est un logiciel gratuit et open source d'analyse et de visualisation de réseaux (réseaux complexes, dynamiques, multiniveaux, etc.), développé en Java et basé sur la plateforme NetBeans. Il a été initialement développé par des étudiants de l'Université de technologie de Compiègne (UTC) en France.
  • NetDraw est un logiciel gratuit développé par Steve Borgatti (professeur à l’Université du Kentucky, Etats-Unis) pour visualiser des donnés de réseaux sociaux. Il utilise les formats des logiciels Pajek, UCINET ainsi que son propre format le VNA.
  • NodeXL est un progiciel gratuit, open source, permettant de représenter des graphiques et des réseaux à partir de MS Excel. Les réseaux peuvent être importés et exportés en différents formats de données (ex : UCINet, Pajek) et à partir de plateformes comme Twitter, Flickr, YouTube et des boîtes mails.
  • Pajek est un logiciel libre, open source, en Python, pour visualiser et analysre de grands réseaux. Il fait partie des logiciels d’analyse de réseaux les plus largement utilisés par les experts en scientométrie.

Text and data mining

  • GROBID (GeneRation Of BIbliographic Dataset) est un outil d’apprentissage automatique (Machine Learning, en anglais) qui permet l’extraction, l’analyse et la re-structuration de documents bruts, tels que des PDF, en documents TEI, notamment pour des publications scientifiques. Cet outil, principalement développé par Patrice Lopez (INRIA), est disponible en open source depuis 2011. Une présentation PPT de GROBID faite par Patrice Lopez à la journée data4ist est disponible.
Tanagra
  • Tanagra est un logiciel gratuit d'exploration de données destiné à l’enseignement et à la recherche. Mis en ligne en 2003, Tanagra est devenu en 2006 un projet éducatif plus large qui s’accompagne maintenant d’une documentation sous forme de cours et de tutoriels accessibles gratuitement.
  • Rapid Miner est un logiciel de data mining et text mining, développé par la société du même nom, dont la version de base est disponible gratuitement.
  • TEXTrend est une plateforme d’analyse et de visualisation d’informations web en science et économie. Les outils de base de TEXTrend sont disponibles gratuitement. TEXTrend est compatible, entre autres, avec les logiciels Weka (classification), R (analyse statistique), Cytoscape et Cfiner (analyse et visualisation de réseaux).
  • Weka est une suite de logiciels libres d’apprentissage automatique, en Java, développé à l’origine par l'université de Waikato en Nouvelle-Zélande. En 2005, Weka a reçu le Data Mining and Knowledge Discovery Service Award décerné par l’association SIGKDD.

Le centre UK NACTeM (National Centre for Text Mining) fournit des liens vers des outils de TDM.

Statistique

  • R est un logiciel libre de traitement des données et d'analyse statistiques utilisant le langage de programmation S.

Outils d’analyse de bases de données d’éditeurs

Base de données Editeur Outils d’analyse
Web of Science (WoS) Institute for Scientific Information (ISI) de Thomson-Reuters Deux outils développés par Thomson-Reuters :
  • La base de données Journal Citation Reports (JCR) de WoS donne le facteur d'impact de plusieurs milliers de journaux scientifiques depuis 1975.
  • L’outil “Citation Index” de WoS permet de connaître le réseau de citations liant les documents, c’est-à-dire le nombre de fois qu’un article a été cité dans d’autres articles.
Scopus Elsevier Un outil développé par Elsevier :
  • SciVal Spotlight est un outil de benchmarking développé par Elsevier pour l’exploitation de sa base de données Scopus, qui permet par exemple de comparer la performance d’institutions de recherche en termes de publications.
Un outil indépendant :
  • SCImago est un site web libre d'accès qui se base sur Scopus pour mesurer le facteur d’impact de revues scientifiques : le SCImago Journal Rank (SJR indicator).

Outils d’analyse des bases de données de moteurs de recherche

  • Scholarometer est une extension Firefox, qui utilise Google Scholar pour analyser les publications d’un auteur ou d’un groupe d’auteurs.
  • Les citations contenues dans la base de données de Google Scholar peuvent également être importées dans les logiciels BibTeX, Zotero, Endnote, etc.
  • CiteseerX est à la fois un moteur de recherche et une librairie numérique dont l’index permet d'ordonner des publications par nombre de citations.

Altmetrics
Les altmetrics (Article Level Metrics) sont un ensemble de méthodes et d'outils complémentaires pour analyser l’impact des travaux de recherche. La production scientifique est analysée à partir de supports variés : traditionnels (articles scientifiques) mais également innovants (vidéos, posts de blogs, bases de données, pages web, logiciels, etc.). Diverses activités numériques sont analysées telles que les partages, recommandations, réutilisations de documents (identifiés par un DOI) et de pages web (identifiées par une URL).

  • ImpactStory est un outil open source, gratuit, développé par un organisme sans but lucratif, qui fournit des métriques alternatives (altmetrics) pour aider les chercheurs à mesurer l’impact de leurs travaux. L’identification à ImpactStory se fait via un identifiant Orcid, permettant une analyse des documents avec DOIs.
  • PlumX Metrics est un outil (payant) développé depuis 2012 par le groupe EBSCO qui permet de connaître l’utilisation faite en temps réel d’articles de recherche, grâce à des indicateurs (usages, captures, mentions, media sociaux et citations) et différentes sources (dont PLOS, PubMed et YouTube). PlumX est utilisé entre autres par l’Université d’Helsinki.
  • Public Library of Science (PLOS) est un éditeur en open access qui fournit depuis 2009 des métriques au niveau des articles, pour tous ses journaux, concernant les téléchargements, citations et partages.

Altmetric.com est une entreprise basée à Londres qui fournit des services payants d'analyse d'activités en ligne liées aux résultats de la recherche. Voir l'article...

Commentaires
Newsletter
49 abonnés
Visiteurs
Depuis la création 2 783 582
Formation Continue du Supérieur
Archives