Actu

ByteDance (TikTok) a secrètement utilisé la technologie d’OpenAI pour entraîner sa propre IA

19 décembre 2023
Par Kesso Diallo
ByteDance a affirmé ne plus utiliser les données générées par GPT dans le cadre de son projet.
ByteDance a affirmé ne plus utiliser les données générées par GPT dans le cadre de son projet. ©Robert Way / Shutterstock

La startup à l’origine de ChatGPT a suspendu le compte de l’entreprise chinoise après avoir appris qu’elle s’était servie de sa technologie pour développer son propre modèle de langage.

En retard dans la course à l’intelligence artificielle (IA), ByteDance, la maison mère de TikTok a un plan pour se faire une place sur ce marché. Elle a lancé le projet Seed, dont l’objectif est de devenir le plus rapidement possible le ChatGPT de Chine, rapporte la newsletter Command Line du média The Verge. À long terme, le but est de construire l’intelligence artificielle générale.

Dans le cadre de ce projet, l’entreprise a notamment lancé Doubao, un chatbot déjà disponible en Chine. Elle a développé ce robot conversationnel à l’aide de la technologie d’OpenAI, la startup à l’origine de ChatGPT. ByteDance s’est en effet secrètement servie de celle-ci afin de mettre au point son propre modèle de langage (LLM). Cela, alors que les conditions d’utilisation de la startup stipulent que les sorties de son modèle ne peuvent pas être utilisés « pour développer des modèles d’intelligence artificielle qui concurrencent nos produits et services ».

Compte suspendu

Suite aux révélations du média américain, une porte-parole de ByteDance a confirmé que les données générées par GPT avaient été utilisées au début du développement du projet Seed, affirmant que ces dernières ont été supprimées des données d’entraînement vers le milieu de l’année 2023. « Nous utilisons GPT pour alimenter des produits et des fonctionnalités sur les marchés non chinois, mais nous utilisons le modèle que nous avons développé pour alimenter Doubao », a-t-elle expliqué.

Selon The Verge, ByteDance continue pourtant d’utiliser l’interface de programmation d’application (API) d’OpenAI d’une manière qui viole ses conditions de service, notamment pour évaluer les performances du modèle alimentant son chatbot. L’équipe derrière le projet Seed aurait reçu l’ordre d’égaler les performances de GPT-3.5 d’ici la fin de l’année et celles de GPT-4 d’ici la mi-2024.

De son côté, OpenAI a suspendu le compte de l’entreprise chinoise à la suite de ses révélations. « Tous les clients de l’API doivent adhérer à nos conditions d’utilisation pour garantir que notre technologie est utilisée à bon escient. Bien que l’utilisation de notre API par ByteDance soit minime, nous avons suspendu leur compte pendant que nous approfondissons notre enquête. Si nous découvrons que leur utilisation ne respecte pas ces conditions, nous leur demanderons de faire les changements nécessaires ou nous supprimerons leur compte », a indiqué un porte-parole de la startup.

À lire aussi

Article rédigé par
Kesso Diallo
Kesso Diallo
Journaliste