Publié le 1 mai 2023
– Mis à jour le 4 décembre 2024
Karen Spärck Jones est l’une des pionnières de la recherche en informatique. Son travail a permis d’établir les principes fondateurs et fondamentaux d’outils d’intelligence artificielle et de moteurs de recherche. Linguiste, elle a étudié la corrélation entre langues, statistiques et ordinateurs.
Le 26 août 1935, Karen Spärck Jones nait à Huddersfield, dans un comté du nord de l’Angleterre. Elle étudie l’histoire et la philosophie au Girton College de Cambridge, de 1953 à 1956.
Durant cette période, elle rejoint le Cambridge Language Research Unit. Elle y rencontre Margaret Masterman, alors à la tête du groupe, qui l’incite à s'orienter vers l'informatique. Ensemble, elles cherchent à améliorer les systèmes de traduction automatique. Pour cela, ces systèmes doivent être en mesure de déterminer l’importance de l’utilisation d’un même mot selon différents contextes. Karen Spärck Jones et Margaret Masterman proposent alors le concept de fréquence inverse des documents (IDF selon l’acronyme anglais). Il s’agit d’une mesure de la fréquence d’apparition d’un terme dans un document. Comme on peut s’y attendre, ce concept fondamental a aussi une application naturelle dans la recherche d’information, car il est important de pouvoir identifier les concepts importants d’un document afin de pouvoir le cataloguer correctement. Et en effet, une variation de l’IDF, appelée TF-IDF, est aujourd’hui encore à la base de la plupart des moteurs de recherche modernes, comme le célèbre Google. Ces travaux sont donc fondamentaux et ont un impact capital dans notre vie quotidienne.
En 1958, Karen Spärck Jones se marie à Roger Needham, chercheur en informatique, cryptographie et sécurité informatique, très reconnu lui aussi. Dans les années 1970, elle intègre le laboratoire d'informatique de l'Université de Cambridge. Ses recherches sont axées sur les systèmes de reconnaissance vocale et sur les systèmes d’intelligences artificielles. En 1982, elle y travaille aussi, à la demande du gouvernement britannique, sur Alvey, un programme institutionnel visant à promouvoir la recherche en sciences informatique.
Elle obtient le poste de professeure d'informatique à l'Université de Cambridge, en 1999, soit trois avant son départ à la retraite.
Au cours de sa carrière, elle a publié neuf livres et plus de 200 articles scientifiques. Sa thèse de doctorat « Classification de la synonymie et sémantique », écrite en 1964 est un des travaux fondamentaux dans le domaine du traitement du langage humain. En 1972, l’article qu’elle publie dans le Journal of Documentation expose de quelles manières les systèmes informatiques peuvent interpréter les mots et leurs relations, au moyen de méthodes statistiques et de la linguistique. Cet article est celui qui a posé les bases des moteurs de recherche.
L'informatique est trop importante pour être laissée aux hommes » - Karen Spärck Jones
Karen Spärck Jones, dont les travaux sont considérés à maints égards comme précurseurs, a marqué le domaine de recherche du traitement du langage naturel. Elle tenait aussi à prévenir les risques liés à l’informatique, parfois trop éloigné des questions sociales et écologiques.
Karen Spärck Jones décède en 2007.
Crédits photos : Association for computing machinery
Date(s)
du 1 mai 2023
au 8 mai 2023