Le test de Turing, conçu en 1950 par le mathématicien Alan Turing, est depuis longtemps considéré comme une référence pour évaluer la capacité d’une machine à imiter l’intelligence humaine. Récemment, le modèle GPT-4.5 d’OpenAI a franchi une étape majeure en surpassant les humains dans une version modernisée de ce test. Cette avancée soulève des questions fascinantes sur l’évolution de l’intelligence artificielle et ses implications pour l’avenir.
Un test de Turing revisité

Dans cette nouvelle version du test, menée par des chercheurs de l’Université de Californie à San Diego (UCSD), des participants ont été invités à tenir des conversations simultanées avec un humain et une intelligence artificielle, sans savoir qui était qui. Leur objectif : déterminer lequel des deux interlocuteurs était humain. GPT-4.5, lorsqu’il adoptait une personnalité spécifique, a réussi à convaincre les interrogateurs qu’il était humain dans 73 % des cas, dépassant même les véritables participants humains.
Les résultats comparatifs

Outre GPT-4.5, plusieurs autres modèles ont été évalués, notamment LLaMA 3.1 de Meta et le chatbot historique ELIZA des années 1960. Les résultats montrent que GPT-4.5 domine largement, tandis que les versions plus anciennes comme GPT-4o et ELIZA ont obtenu des scores respectifs de 21 % et 23 %. Ces chiffres illustrent la rapidité avec laquelle les modèles d’intelligence artificielle évoluent.
L’importance du « persona »

L’un des aspects clés de cette étude réside dans l’utilisation d’un « persona ». Lorsque GPT-4.5 recevait des instructions pour adopter une personnalité spécifique, comme celle d’un jeune adulte familier d’Internet et utilisant du langage familier, ses performances augmentaient considérablement. Avec un simple prompt neutre, son taux de réussite tombait à 36 %. Cela montre que la capacité d’une IA à simuler une personnalité joue un rôle crucial dans sa crédibilité.
Des interrogateurs déconcertés

Les chercheurs ont noté que les participants humains avaient souvent du mal à distinguer l’IA des véritables humains. En fait, GPT-4.5 a été jugé plus humain que les participants réels dans de nombreux cas. Cela met en évidence la capacité des modèles modernes à produire des réponses convaincantes et adaptées au contexte.
Une avancée impressionnante mais pas encore une IAG

Malgré ces résultats impressionnants, les chercheurs soulignent que cela ne signifie pas que nous avons atteint l’Intelligence Artificielle Générale (IAG), c’est-à-dire une IA capable de penser et d’agir comme un humain dans tous les domaines. Cameron Jones, auteur principal de l’étude, rappelle que ces performances reflètent avant tout la capacité des modèles à s’adapter aux scénarios spécifiques pour lesquels ils sont entraînés.
Conclusion

L’exploit réalisé par GPT-4.5 marque une étape importante dans le développement de l’intelligence artificielle conversationnelle. Cependant, il soulève également des questions éthiques et sociétales sur l’utilisation de ces technologies dans nos interactions quotidiennes. Alors que les frontières entre humain et machine deviennent de plus en plus floues, il est essentiel d’encadrer ces avancées pour garantir qu’elles servent au mieux les intérêts de la société.