Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Formation Continue du Supérieur
7 septembre 2016

Rapport sur l'interaction des sciences humaines et sociales avec les sciences technologiques et les sciences du vivant

http://www.assemblee-nationale.fr/commun/ceresian/images/logo-an.pngExtraits

Notre travail sur les humanités numériques s’est organisé autour de plusieurs thèmes. Je vais revenir plus en détail sur deux d’entre eux.
Le premier, très à la mode, est l’analyse de données (le Big Data). L’analyse de données se pratique dans les sciences dures, en astronomie par exemple. À partir d’un grand nombre de photos, on essaie de reconnaître toutes les planètes et des formes de galaxies. Mais, concernant les analyses sur les textes, je vais citer un travail particulier : Hyperbase d’Etienne Brunet, un système de traitement de texte conçu pour explorer, faire de l’analyse statistique sur les œuvres littéraires pour en faire ressortir de nouveaux aspects. On obtient ainsi des résultats passionnants, par exemple pour la Bible en permettant de distinguer différents écrivains de l’Ancien testament. Des travaux similaires portent aussi sur le Nouveau testament. L’analyse de données, bien connue depuis longtemps dans les sciences dures, est en train d’investir de façon massive les sciences humaines et sociales...

Les relations entre sciences, techniques et société sont donc aujourd’hui beaucoup plus compliquées qu’il y a cinquante ans. Je pense qu’il existe, de temps en temps, des convergences. Mais, d’un point de vue heuristique, on a d’abord intérêt à parler d’altérité et d’incommunication des mondes symboliques, plutôt que de penser naturellement que l’homme va converger avec la science et la technique. De ce point de vue, tout ce qui est technologique est intéressant, car la technologie rencontre immédiatement la société, donc les hommes, par conséquent l’irrationnel profond. Les hommes, c’est l’histoire et la folie, selon la fameuse phrase de Shakespeare. Du point de vue scientifique, je suis obsédé par cette question théorique : comment, dans un monde ouvert interactif, préserver cette logique qui ne sert à rien mais qui est fondamentale pour l’avenir, celle de la connaissance et de la liberté ?

Je vais présenter rapidement une avancée en linguistique historique, sur ce que l’on appelle les mots fantômes et une base de données de ces mots. En linguistique historique, on s’appuie, comme souvent en lexicographie quand on fait un dictionnaire, sur la reprise des dictionnaires précédents, que l’on complète. Des mots apparaissent, appelés pseudo-lexèmes, avec des sens qui n’ont jamais existé. Ils se trouvent dans des dictionnaires historiques très connus, par exemple le Godefroy de la fin du XIXe siècle, ou le FEW (Französisches Etymologisches Wörterbuch), dictionnaire étymologique français de von Wartbourg du XXe siècle. Leur correction et leur chasse est aujourd’hui le résultat de recherches menées avec la confrontation de grands corpus. On prend, par exemple, une entité lexicale apparaissant dans un dictionnaire historique, dont on ne sait pas trop d’où elle vient, en y ajoutant une citation. On va rechercher dans des corpus de la même époque les différentes occurrences. Quand on ne les retrouve quasiment que chez un seul auteur ou dans un seul document, même si c’est dans le meilleur dictionnaire du monde, il y a présomption de présence de mot fantôme. Voir l'article...

Commentaires
Newsletter
49 abonnés
Visiteurs
Depuis la création 2 783 378
Formation Continue du Supérieur
Archives