Une étude récente publiée dans le Nexus PNAS Le journal suggère que la montée en puissance de modèles d’IA comme ChatGPT pourrait remettre en question la domination des sites de partage de connaissances traditionnels comme Reddit et le forum de programmation Stack Overflow. Ce changement pourrait avoir un impact sur la disponibilité d’informations publiques librement accessibles.
L’étude, menée par Maria del Rio-Chanona et ses collègues, montre que Stack Overflow a constaté une baisse de 25 % de l’activité des utilisateurs six mois seulement après le lancement de ChatGPT.
Cette baisse n’a pas été observée sur des sites similaires où l’accès à ChatGPT est restreint, soulignant l’impact significatif de l’adoption rapide du modèle d’IA. Selon l’étude, les utilisateurs pourraient se tourner vers les réponses générées par l’IA au lieu de rechercher du contenu piloté par l’homme, modifiant ainsi la manière dont les gens obtiennent des informations en ligne.
(Crédit image : Maria del Rio-Chanona)
“Les LLM sont si puissants, ont une telle valeur et ont un impact énorme sur le monde. On commence à s’interroger sur leur avenir”, déclare Del Rio-Chanona, qui est également membre associé du corps professoral de la Centre scientifique de complexité (CSH). Les résultats soulèvent des inquiétudes quant au fait qu’une dépendance croissante à l’égard de l’IA pourrait réduire le nombre de contributions aux forums publics, entraînant ainsi une pénurie de données diverses et authentiques nécessaires à la formation des futurs modèles. « Cela a des implications assez importantes. Cela signifie qu’il n’y aura peut-être pas suffisamment de données publiques pour former des modèles à l’avenir », prévient-elle.
Python et JavaScript
Cette tendance pourrait perturber l’écosystème Web ouvert, car les outils d’IA comme ChatGPT s’appuient sur des connaissances partagées publiquement pour les données de formation. “Même les modèles d’IA comme ChatGPT sont formés sur du contenu généré par l’homme comme les publications Stack Overflow”, explique Johannes Wachs, membre du corps professoral du CSH. Ironiquement, à mesure que l’IA remplace ces plates-formes, la qualité des données de formation peut se détériorer avec le temps.
L’impact est particulièrement prononcé dans les publications liées aux langages de programmation largement utilisés comme Python et JavaScript, où l’activité a considérablement diminué. L’étude suggère que ce changement ne se limite pas aux novices mais affecte les utilisateurs à tous les niveaux d’expérience, indiquant un large passage des interactions publiques aux interactions privées sur les plateformes d’IA.
Avec moins de personnes contribuant aux plateformes publiques, les modèles d’IA pourraient éventuellement s’appuyer sur des données de moindre qualité, ce qui pourrait dégrader leurs performances. Les chercheurs appellent à une approche équilibrée qui maintienne l’échange ouvert des connaissances tout en adoptant les progrès de l’IA.