Skip to content

Le robot qui n’obéit à personne

Pour comprendre l’ampleur du problème, il faut plonger dans les entrailles techniques de Perplexity AI. Au cœur de son système se trouve PerplexityBot, un robot d’exploration web qui parcourt Internet en permanence, indexant des milliards de pages. Contrairement aux robots traditionnels comme Googlebot qui respectent généralement les règles établies par les sites web via le fichier robots.txt, PerplexityBot aurait adopté des tactiques beaucoup plus agressives. En août 2024, Cloudflare, l’une des plus grandes entreprises d’infrastructure Internet au monde, a publié un rapport accablant. Selon leurs analyses, Perplexity utilisait des robots non déclarés, des crawlers furtifs qui contournaient délibérément les interdictions d’accès mises en place par les sites web. Ces robots se faisaient passer pour des navigateurs normaux, masquant leur véritable identité pour échapper aux systèmes de détection. Cloudflare a comparé ces techniques à celles utilisées par des hackers nord-coréens, une accusation dévastatrice pour une entreprise qui se veut respectable.

Mais le problème ne s’arrête pas là. Perplexity ne se contente pas d’indexer les contenus publics. Selon les plaintes déposées, l’entreprise accéderait également aux contenus protégés par des paywalls, ces barrières payantes que les médias érigent pour protéger leur modèle économique. Comment ? En exploitant des failles techniques, en utilisant des comptes d’essai, ou simplement en ignorant les restrictions d’accès. Le New York Times affirme que Perplexity a copié des millions d’articles, y compris des enquêtes exclusives, des analyses approfondies, des reportages qui ont coûté des mois de travail et des centaines de milliers de dollars. Ces contenus sont ensuite intégrés dans les bases de données de Perplexity, utilisés pour entraîner ses modèles d’intelligence artificielle, et redistribués aux utilisateurs sous forme de réponses synthétisées. Le tout sans autorisation, sans compensation, sans même un remerciement. C’est du vol à l’échelle industrielle, automatisé, systématique, impitoyable.

Les hallucinations qui détruisent des réputations

Mais il y a pire que le vol. Il y a la fabrication pure et simple d’informations fausses. Dans sa plainte, le New York Times donne un exemple glaçant. Un utilisateur a demandé à Perplexity quelles caractéristiques Wirecutter, le site de recommandations de produits du Times, appréciait dans le Boppy Lounger, un coussin pour bébé. La réponse de Perplexity ? Une liste détaillée de fonctionnalités prétendument louées par Wirecutter. Le problème ? Wirecutter n’a jamais testé ce produit. Jamais. Et pour cause : le Boppy Lounger a été rappelé après avoir causé la mort de plusieurs nourrissons. En inventant de toutes pièces un avis positif sur un produit mortel, Perplexity n’a pas seulement commis une erreur technique. Elle a potentiellement mis en danger des vies humaines. Et elle a détruit la crédibilité du New York Times, en associant son nom à une recommandation qu’il n’a jamais faite. C’est ce que l’industrie de l’IA appelle pudiquement une hallucination, un terme qui minimise la gravité du problème.

Ces hallucinations ne sont pas des bugs isolés. Elles sont inhérentes au fonctionnement même des modèles de langage. Ces systèmes ne comprennent pas vraiment ce qu’ils disent. Ils prédisent simplement le mot le plus probable dans une séquence, en se basant sur des milliards d’exemples vus pendant leur entraînement. Quand les données sont incomplètes ou ambiguës, le modèle invente, comble les trous avec des informations plausibles mais fausses. Et quand ces inventions sont présentées avec le logo du New York Times, accompagnées de citations qui semblent authentiques, les utilisateurs n’ont aucun moyen de distinguer le vrai du faux. Le Times affirme que ces fausses attributions violent non seulement ses droits d’auteur, mais aussi ses marques déposées sous le Lanham Act, la loi américaine qui protège les marques commerciales. En associant son nom à des contenus qu’il n’a pas produits, Perplexity dilue la valeur de la marque New York Times, trompe les consommateurs, et détruit la confiance patiemment construite pendant plus d’un siècle.

Imaginez un instant que vous soyez journaliste au New York Times. Vous passez six mois sur une enquête, vous interviewez des dizaines de sources, vous vérifiez chaque fait trois fois. Vous publiez votre article, fier de votre travail. Et le lendemain, vous découvrez que Perplexity a copié votre texte, l’a résumé en trois paragraphes, et l’a redistribué à des millions d’utilisateurs qui ne viendront jamais lire votre article original. Pire encore, l’IA a ajouté des informations fausses, des citations inventées, et a mis votre nom dessus. Comment vous sentiriez-vous ? Volé ? Trahi ? Impuissant ? C’est exactement ce que vivent des milliers de journalistes aujourd’hui. Et personne ne semble s’en soucier, tant que l’IA nous donne des réponses rapides.

Sources

Sources primaires

Courthouse News Service, « New York Times joins copyright fight against AI startup Perplexity », 5 décembre 2025. The Guardian, « New York Times sues AI startup for ‘illegal’ copying of millions of articles », 5 décembre 2025. Reuters, « New York Times sues Perplexity AI for ‘illegal’ copying of copyrighted works », 5 décembre 2025. Yahoo Finance via The Wall Street Journal, « New York Times Escalates Battle Against Perplexity With New Lawsuit », 5 décembre 2025. Chicago Tribune, « Chicago Tribune sues Perplexity AI for copyright infringement », 4 décembre 2025.

Sources secondaires

Les Numériques, « Qu’est-ce que Perplexity AI et comment l’utiliser », 5 janvier 2025. Cloudflare Blog, « Perplexity is using stealth, undeclared crawlers to evade website no-crawl directives », août 2024. The Verge, « The New York Times warns AI search engine Perplexity to stop scraping », 15 octobre 2024. McKool Smith, « AI Infringement Case Updates », diverses dates 2024-2025. Reuters, « Perplexity AI loses bid to dismiss or transfer News Corp copyright case », 21 août 2025.

Ce contenu a été créé avec l'aide de l'IA.

facebook icon twitter icon linkedin icon
Copié!

Commentaires

0 0 votes
Évaluation de l'article
Subscribe
Notify of
guest
0 Commentaires
Newest
Oldest Most Voted
Inline Feedbacks
View all comments
Plus de contenu