Roberto Busa, s.j.

Posted on 3 janvier 2012

0


Qu’il soit ici proposé un multiple sujet : l’oeuvre du jésuite thomiste Roberto Busa pour les digital humanities, tel que le rapporte Philarête, l’auteur passionnant de l’Esprit de l’Escalier.

Il n’est qu’à lire in extenso, et ces quelques extraits :

Le Père Roberto Busa, s.j. Tout le monde s’accorde à reconnaître en lui le pionnier de ce qu’on appelle désormais les Digital Humanities– en français l’« informatique appliquée aux sciences humaines ». Roberto Busa s’est éteint le 9 août dernier, à l’âge de 97 ans, dans une indifférence quasi générale. Il est notre homme de l’année. Il n’y a plus qu’à le faire connaître.

« Il était né seulement pour faire des comptes, le computer, de l’anglais to compute, calculer, compter. Mais le père Busa insuffla dans ses narines le don de la parole ». La formule, lue dans L’Osservatore Romano après sa mort, est frappée d’un lyrisme réservé à ce type de publication, mais elle fait assez bien saisir ce que représente Roberto Busa. Il fut le premier, ou l’un des tous premiers, à comprendre que les nouveaux outils utilisés pour manier des chiffres, pour faire des statistiques à des fins scientifiques, guerrières ou commerciales pouvaient également servir la culture et les humanités. Il fut incontestablement le premier, en tous cas, à mettre cette idée en pratique. Busa fut l’artisan d’une première et monumentale réalisation : la confection de l’Index thomisticus, c’est-à-dire de la première concordance intégrale réalisée grâce à l’informatique sur l’œuvre complète d’un auteur. L’auteur était saint Thomas d’Aquin, et l’on se fera une idée du caractère gigantesque de l’entreprise en considérant que le corpus thomasien compte environ 10,5 millions de mots. Les œuvres connues d’Aristote en comptent un million, celles de Platon un demi million. Dans l’Index thomisticus, chacun des mots écrits par Thomas est répertorié, avec son contexte et la référence précise. Il est, le cas échéant, relié à son lemme (la forme principale du mot, qui peut être décliné s’il s’agit d’un nom, conjugué s’il s’agit d’un verbe, etc.). L’Index propose évidemment les statistiques de fréquence, qui sont d’une grande utilité pour les lexicographes. Le travail mené par le P. Busa, avec la collaboration d’IBM, commença en 1948. Le premier volume imprimé sortit en 1974, et l’ensemble des 56 volumes achevé en 1980. Il s’agit probablement du plus grand ouvrage publié à ce jour. Et comme Roberto Busa ne cessa jamais d’accompagner, sinon de précéder, les innovations constantes dans le domaine informatique, il veilla également à ce que l’Index fut, dès que possible, édité sous forme de CD-Rom, avant de donner son accord à sa mise en ligne, effective en 2005. Au long d’une vie de travail incessante, il posa les fondements de l’hypertexte, de l’analyse linguistique et de la lexicographie informatisée, et réalisa des avancées décisives dans le domaine de l’« intelligence artificielle » et de la traduction automatique.

et :

Roberto Busa joua un rôle décisif dans l’invention de ce qu’on appelle désormais l’hypertexte. C’est un des aspects où l’informatique représente un saut qualitatif, et non seulement quantitatif, dans l’édition de textes : elle permet d’enrichir le texte par diverses « balises » qui signalent, par exemple, que certains mots sont une citation d’un auteur et non les propres mots du rédacteur du texte, que tel nom propre est un nom de lieu ou de personne, ou qu’il existe pour tel passage telle ou telle variante dans un autre manuscrit. Dans le domaine des études médiévales, un grand travail issu de cette technique fut l’étude d’un cadastre florentin du XVe siècle (Les Toscans et leurs familles. Une étude du Catasto florentin de 1427, par D. Herlihy et Ch. Klapisch-Zuber, 1978). À la même époque paraissaient les 56 volumes de l’Index thomisticus. Busa n’était plus seul : de par le monde, des chercheurs de toutes disciplines recourraient désormais à l’informatique pour mener à bien des travaux dont la possibilité même n’aurait pu être envisagée sans cet outil.

Mais tout est à lire dans ce billet de Philarète (bis), auquel ces quelques liens sont ajoutés sous l’invitation de Wikipedia/Roberto_Busa :

Corpus Thomisticum
Web-based Index Thomisticus search engine
Index Thomisticus Treebank

& :
ADHO | ADHO/Resources (Alliance of Digital humanities).
Digital Humanities International, veille sur les « Humanités Numériques et champs associés » (CNAM, FR).
OpenEdition.org (Revues.org, Calenda, Hypotheses.org) | Revues.org ? (webOL).
– Twitter/@marindacos/digitalhumanities