SuisseL'EPFL veut booster les pages «invisibles» de Wikipédia
Certaines pages de l'encyclopédie en ligne méritent d'être davantage vues. C'est pourquoi des chercheurs vaudois ont mis au point un nouvel outil.

L'encyclopédie en ligne compte plus de 60 millions d'articles à consulter gratuitement.
GettyIl est loin le temps où Wikipédia n'avait pas la cote auprès des écoles. Qui n'a pas été remis en place par un prof après s'être (trop?) inspiré de l'encyclopédie en ligne pour faire un exposé? Aujourd'hui, c'est l'inverse. La très sérieuse EPFL veut même doper les vues de certaines pages du site qui ne seraient pas assez consultées.
Vase communicant entre les langues
Car environ 15% des 60 millions d'articles de Wikipédia, toutes langues confondues, ne contiennent aucun lien hypertexte. On les appelles les «pages orphelines». Jeux de ping-pong et de renvois oblige, celles-ci sont deux fois moins consultées que les autres, ont constaté des chercheurs de la Faculté informatique et communications de l’EPFL. Pourtant, elles ne sont pas forcément moins intéressantes. «Wikipédia est un réseau au même titre que les routes, Internet, les composés chimiques ou les gènes, et tout réseau repose sur le concept de la navigabilité, qui permet d’aller d’un endroit à un autre», souligne Akhil Arora, auteur principal de l'analyse.
L'IA à la rescousse
En se plongeant dans le corpus, les scientifiques ont constaté que certaines pages étaient orphelines dans une langue, mais pas forcément dans une autre. C'est spécialement le cas pour l'arabe égyptien (78% de pages orphelines) et le vietnamien (50%). «Si le même article n’est pas orphelin dans une autre langue, cela signifie que les rédacteurs ont pu trouver d’autres articles pouvant renvoyer à cet article, précise Akhil Arora. Il suffisait donc de transférer le lien des autres langues vers la langue dans laquelle l’article était orphelin. Nous avons découvert que cette approche permettait de suggérer des liens pour plus de 63% des articles orphelins.»
La Fondation Wikimédia, qui gère la plateforme, travaille avec l'EPFL. Un outil est en cours d'élaboration pour guider les rédacteurs à l’endroit d’une page où ils devraient envisager d’ajouter de nouveaux concepts qui utiliseront ensuite l’IA générative pour suggérer un texte de départ. Un contrôle humain sera toujours effectué. «Wikipédia est un service en libre accès incroyable, estime le chercheur. C’est pourquoi les outils que nous créons sont si utiles aux rédactrices et rédacteurs qui font ce travail formidable.»