Linkup : Un Pont Entre les LLMs et les Contenus Premium
Imaginez un assistant IA capable de répondre à toutes vos questions avec précision, en s'appuyant sur des sources d'information fiables et à jour. C'est exactement ce que promet la startup française Linkup, en développant une API qui connecte les grands modèles de langage (LLMs) avec du contenu Web premium provenant d'éditeurs de confiance.
Un défi majeur pour les LLMs : le manque de données actualisées
Si vous avez déjà utilisé ChatGPT Search ou Perplexity, vous savez à quel point la capacité à rechercher sur le Web et à citer des sources améliore grandement ces chatbots IA. Les résultats sont meilleurs lorsqu'ils impliquent des informations actualisées. De plus, la recherche Web peut réduire ce qu'on appelle les "hallucinations", c'est-à-dire lorsqu'une IA générative produit des informations incorrectes.
Le problème épineux du "scraping" Web
Cependant, l'avenir des robots d'exploration du Web est incertain. En l'absence d'accord financier préalable entre les éditeurs de contenu et les entités qui "scrappent" les pages Web, ces robots récupèrent du contenu sur le Web ouvert sans payer. Une pratique qui ne plaît pas à tout le monde et qui fait l'objet d'une surveillance réglementaire accrue autour de l'entraînement des IA.
Des procès très médiatisés sont en cours, comme celui qui oppose OpenAI, le créateur de ChatGPT, au New York Times. La situation pourrait donc changer prochainement en ce qui concerne le scraping du Web. C'est pourquoi OpenAI a signé des accords pluriannuels de licence de contenu avec de grands éditeurs comme AP, Axel Springer, Condé Nast, El País, le Financial Times, Le Monde, etc.
Linkup, le chaînon manquant entre IA et éditeurs
C'est dans ce contexte que Linkup a vu le jour. Comme l'explique son co-fondateur et PDG Philippe Mizrahi :
Nous avons créé l'entreprise à peu près au moment où OpenAI concluait des accords avec des sources d'information... à des fins d'entraînement ou d'inférence, pour augmenter les réponses des modèles et des produits d'OpenAI. Et nous nous sommes dit : "C'est génial parce que nous avons enfin des entreprises d'IA qui paient leurs sources."
Philippe Mizrahi, co-fondateur et CEO de Linkup
Actuellement, les éditeurs de contenu sont confrontés à des décisions difficiles quant à l'attitude à adopter face à la soif de données des IA génératrices. Ils peuvent bloquer les robots d'exploration à l'aide du fichier de métadonnées robots.txt, poursuivre en justice les entreprises d'IA qui auraient enfreint leurs droits d'auteur ou bien autoriser les robots à indexer librement leur contenu. La dernière option est de licencier leur contenu aux développeurs d'IA pour obtenir une compensation pour leur propriété intellectuelle.
Un marché de niche à fort potentiel
Mais il existe des milliers d'entreprises technologiques utilisant l'IA qui n'ont pas l'envergure et la portée d'OpenAI. Linkup cible précisément ces acteurs, comme le souligne Mizrahi :
Nous ciblons vraiment les applications qui implémentent l'IA dans leurs propres produits. Le cas d'utilisation typique est que je crée une application d'IA en utilisant un modèle de Mistral ou d'OpenAI. Je construis mon propre pipeline, mais j'ai besoin d'enrichir ce pipeline avec des informations externes.
Philippe Mizrahi, co-fondateur et CEO de Linkup
Pour y parvenir, Linkup n'est pas seulement une solution technique. C'est un marché, un intermédiaire entre les éditeurs de contenu et les entreprises qui souhaitent enrichir les réponses de leurs LLM avec du contenu Web de qualité.
Comment fonctionne l'API Linkup ?
Linkup signe des accords de licence de contenu avec les éditeurs et s'intègre à leur CMS afin de pouvoir récupérer le contenu sans aucun scraping. Ensuite, Linkup rémunère les partenaires de contenu en fonction de la fréquence à laquelle leur contenu est consulté par les clients de Linkup.
La startup s'est concentrée dans un premier temps sur les informations d'entreprise et économiques. En plus des sites d'actualités, elle travaille avec des bases de données de connaissances, comme Statista, Xerfi ou d'autres ressources du même type.
- L'API Linkup permet d'accéder à du contenu web premium de sources fiables.
- Les éditeurs sont rémunérés en fonction de l'utilisation de leur contenu via Linkup.
- Linkup se concentre pour l'instant sur les informations économiques et d'entreprise.
La startup lève 3 millions d'euros pour accélérer
Linkup n'est pas la seule startup à travailler sur cette problématique d'apport de contenu premium aux LLMs via des contrats de licence. Son concurrent le plus visible est ScalePost, qui travaille avec Perplexity pour accélérer ses accords de licence avec les éditeurs.
Mais Linkup compte bien se développer rapidement. La startup a levé il y a quelques mois 3 millions d'euros lors d'un tour de table seed auprès d'Axeleo Capital, Motier Ventures, Seedcamp et une centaine de business angels.
Une dizaine de personnes travaillent actuellement pour la startup, qui prévoit de recruter une dizaine d'autres collaborateurs dans l'année. Un bel exemple de l'écosystème tech français en ébullition autour de l'IA !