[accès libre] Pourquoi ChatGPT n’est pas chinois ? 16 mars 2023 A deux jours d’intervalles, OpenAI publie son ChatGPT 4 tandis que Baidu lance Ernie, son robot conversationnel. Dans cet article, Jean-Yves Larguier revient sur les grands enjeux pour la Chine dans cette industrie stratégique. Depuis quelques années, il était bon ton en Chine d’ignorer en apparence du moins, la Silicon Valley. Le dynamisme de la scène technologique chinoise se suffisait à lui-même, et les entrepreneurs pouvaient admirer les réussites du pays dans l’intelligence artificielle. Mais ce doux récit a volé en éclat en novembre 2022 avec la sortie de ChatGPT par OpenAI. Témoignage de la curiosité suscitée par les performances de ChatGPT, les internautes chinois ont tous cherché à l’essayer. Malgré la difficulté pour le grand public chinois d’accéder à l’application, certains ont trouvé sur des sites de e-commerce des moyens d’obtenir un code d’accès via un numéro de téléphone étranger et de se connecter depuis l’étranger. Ce commerce florissant a toutefois été rapidement stoppé par ces mêmes plateformes, sur ordre des autorités. La percée de ChatGPT dans le domaine de l’IA générative a mis en lumière les performances de l’IA. La Chine a depuis longtemps placé l’intelligence artificielle en haut de ses priorités technologiques et bénéficie du soutien de politiques publiques conséquentes. Comme le rappelle Pascal Boniface dans son ouvrage « Géopolitique de l’intelligence artificielle », la Chine a connu son propre « moment Spoutnik » : « il a eu lieu en mai 2017 lorsque Alpha Go, programme d’intelligence artificielle développé par la société britannique DeepMind (rachetée en 2014 par Google), a battu le champion du monde chinois de jeu de go Ke Jie ». Depuis, la Chine s’est engagée dans une véritable course technologique autour de l’intelligence artificielle, avec des applications prévues dans des domaines clés tels que l’internet, la recherche scientifique, la conduite autonome, la santé, l’éducation, la sécurité et le militaire. Ces avancées technologiques devraient jouer un rôle majeur à la fois sur le plan économique et géopolitique, et toutes les puissances doivent investir dans l’IA sous peine d’être déclassées. En octobre 2018, lors de son discours devant le Politburo du Comité central du Parti communiste chinois (PCC), Xi Jinping avait souligné que « l’IA est une technologie stratégique qui ouvre la voie à cette nouvelle ère de révolution scientifique et industrielle et de changement industriel, et qu’elle a un effet de « tête d’oie » (头雁) avec une forte capacité de stimulation ». La Chine et les États-Unis rivalisent pour prendre la tête dans ce nouveau domaine. La Chine avait depuis longtemps espéré un « reset technologique », une sorte de remise à zéro pour placer la Chine et les autres puissances sur la même ligne de départ. Hors du jeu au moment de la révolution industrielle, en retard dans les technologies de l’information, la Chine tient avec l’IA son opportunité de faire jeu égal dans cette transformation technologique. Elle aspire même à devenir le leader de l’innovation en intelligence artificielle d’ici 2030, un enjeu crucial pour devenir la première puissance mondiale. La Chine souhaite faire de l’IA son futur moteur économique en la déployant dans des domaines clés. Il est important d’étudier la stratégie de la Chine dans cette course technologique et d’analyser les avantages et les défis auxquels elle est confrontée dans cette compétition mondiale. L’arrivée de ChatGPT confronte la Chine à la réalité de la technologie américaine et l’amène à évaluer son positionnement après des années d’investissements, tout en suscitant des interrogations quant à savoir pourquoi ChatGPT n’est pas une invention chinoise ? La Chine surprise par la performance de l'Intelligence Artificielle de ChatGPT Au cours des dernières semaines, l’outil d’IA générative développé par OpenAI a été largement commenté dans les médias, et en particulier sur les réseaux sociaux chinois, où beaucoup ont exprimé leur indignation face à l’avance de ChatGPT sur les projets portés par les champions nationaux. ChatGPT est un robot conversationnel, un programme informatique qui peut comprendre et générer du langage naturel. Il repose sur GPT-3.5, un modèle de langage large (LLM), entraîné sur de vastes ensembles de données, en utilisant une combinaison d’apprentissage supervisé et renforcé à partir de commentaires humains. GPT (Generative Pre-trained Transformer) est un modèle prédictif de langage naturel qui peut générer du texte en se basant sur une probabilité estimée de la prochaine suite de mots. Cependant, il ne possède pas de capacité de raisonnement. Pour initier son entraînement, le modèle utilise la méthode d’entraînement appelée « apprentissage profond par transfert », qui utilise des couches de neurones pré-entraînées sur de grandes quantités de données pour améliorer ses performances. Les modèles de langage de grande taille nécessitent une puissance de calcul importante. Pour accélérer et améliorer le processus d’entraînement, des puces spécialisées pour le calcul intensif, telles que les unités de traitement graphique (GPU) et les unités de traitement tensoriel (TPU), sont essentielles. Le modèle GPT-3.5, entraîné sur 570 gigaoctets de texte, compte 175 milliards de paramètres, cent fois plus que son prédécesseur GPT-2. Chacun de ces paramètres dans les technologies des Réseaux de Neurones Artificiels est comparable à un neurone qui interagit avec d’autres pour comprendre et réagir à son environnement. En plus du nombre de paramètres, l’architecture du modèle, la densité des réseaux de neurones ainsi que la richesse du corpus d’entraînement, le réglage fin du modèle sont également essentiels pour la qualité d’une IA générative. En décembre 2022, ChatGPT aurait réussi le test de Turing, une évaluation de l’IA dans laquelle un humain est incapable de distinguer entre une réponse générée par un robot conversationnel et une réponse humaine. Pour aller encore plus loin, le modèle de ChatGPT devra également se confronter à d’autres tests plus complexes pour comprendre les nuances du langage et résoudre les ambiguïtés de phrase, tels que le Winograd Schema. Si la troisième version de ChatGPT a bousculé les géants de la tech, ces derniers se préparent désormais à intégrer des solutions de robots conversationnels dans leurs applications : Microsoft a récemment annoncé l’intégration du modèle GPT d’OpenAI dans Bing, offrant une expérience utilisateur similaire à celle de ChatGPT dans son moteur de recherche. Google, quant à lui, a dévoilé BARD, son propre robot conversationnel alimenté par son modèle de langage LaMDA, qui sera bientôt disponible pour le grand public. Cette technologie de robots conversationnels pourrait bien révolutionner l’expérience utilisateur des moteurs de recherche, mais aussi la productivité des entreprises en complétant voire même en remplaçant l’humain pour certaines tâches. L’IA générative est désormais envisagée dans de nombreux domaines, tels que le service client, l’éducation ou encore la programmation informatique. La Chine est également engagée dans cette course et s’apprête à dévoiler ses propres avancées dans l’IA générative ChatGPT a remis la compétition dans l’intelligence artificielle sur le devant de la scène. Pas question pour les entreprises chinoises d’être à la traine. Baidu, la plus grande entreprise de moteur de recherche de Chine, a annoncé le lancement d’un service de chatbot conversationnel pour fin mars 2023, qui sera intégré dans son moteur de recherche. Appelée Ernie, pour « Enhanced Representation through kNowledge IntEgration », ou « Wenxin Yiyan 文心一言 » en chinois, la solution a été introduite pour la première fois en 2019 et a depuis élargi ses capacités pour inclure la compréhension et génération de langage et la génération de texte vers l’image. Baidu devient ainsi le premier de ses homologues chinois à rejoindre la course mondiale, sachant que ChatGPT et Google ne sont pas disponibles en Chine. La question est de savoir si Baidu sera capable de les concurrencer sur le marché international. Selon The Register explique que son modèle de langage pré-entraîné, appelé « ERNIE 3.0 Titan », comprend 260 milliards de paramètres, soit davantage que les 175 milliards de paramètres du modèle GPT-3 de ChatGPT. Une Chine ambitieuse et dynamique en Intelligence Artificielle La Chine dispose de plusieurs atouts majeurs, tout d’abord avec sa puissance financière. En 2021, l’industrie de l’IA en Chine continentale a bénéficié d’un financement de 17,21 milliards de dollars provenant d’investissements privés, complétés par des subventions publiques du gouvernement central et des collectivités locales dans le cadre du Plan de Développement National de l’Intelligence Artificielle de Nouvelle Génération (NGAIDP). Les universités et instituts participent à cette dynamique, en formant davantage d’ingénieurs en IA que les États-Unis, et en menant d’importants travaux de recherche et conférences. L’Académie de l’intelligence artificielle de Beijing a développé Wu Dao 2.0, le plus grand modèle d’IA pré-entraîné au monde avec 1,75 trillion de paramètres (10 fois plus que GPT-3, mais des résultats encore confidentiels), pour simuler le langage conversationnel et comprendre les images. Wu Dao a la particularité d’avoir été entraîné sur des corpus chinois différents de ceux des États-Unis, les différences culturelles et linguistiques jouant un rôle important dans l’IA générative. La Chine dispose également d’un avantage considérable grâce à sa grande quantité de données provenant aussi bien de plateformes d’e-commerce, du secteur de la santé, des applications de paiement que de caméras de surveillance. Contrairement aux sociétés occidentales qui sont plus revendicatives et mieux protégées en ce qui concerne l’utilisation de leurs données, les citoyens sont en position moins favorable face aux contrôles et au partage de leurs données. Les entreprises chinoises bénéficient d’une réglementation très favorable pour l’utilisation de ces données collectées par le gouvernement et le secteur privé, ce qui crée un marché important pour les entreprises spécialisées en intelligence artificielle axées sur les applications pratiques. L’État chinois encourage le regroupement des acteurs de l’IA autour de pôles régionaux. En particulier à Beijing où 1048 entreprises ont été recensées en octobre 2022, soit un tiers des entreprises du pays. Cela permet une forte concentration de talents, avec une communauté de 40 000 experts en IA. D’autres pôles se sont développés autour de Shanghai et Shenzhen. Le gouvernement chinois incite également les entreprises du secteur privé, telles qu’Alibaba, CloudWalk, iFlytek et Sensetime, à collaborer avec l’Armée populaire de Libération et services de sécurité pour partager leurs innovations technologiques et leurs infrastructures, créant ainsi un complexe militaro-numérique. Cette stratégie de fusion militaro-civile est considérée comme l’un des facteurs ayant contribué à la croissance rapide de l’industrie de l’IA en Chine ces dernières années. Les géants de la technologie chinois tels que Baidu, Bytedance, Huawei, Inspur, Tencent, Alibaba et SenseTime possèdent une expertise avancée en matière d’IA, ainsi qu’une grande quantité de données nécessaires pour développer un modèle. Alibaba a placé l’IA au centre de son laboratoire de recherche international DAMO Academy. L’enterprise teste actuellement son outil d’IA générative et de robot conversationnel, qu’elle pourrait éventuellement combiner avec l’application de communication du groupe, DingTalk. Quant à Tencent, son AI Lab a développé l’outil Different Dimension Me de génération d’images dans la famille de DALL-E d’OpenAI. Comme les GAFAM, les géants de la tech en Chine développent tous des solutions à base d’IA pour les intégrer dans leurs suites d’outils ou super-applications. En tant que membres de « l’équipe nationale en IA », les grandes entreprises technologiques chinoises ont pour mission de développer un écosystème d’IA le plus complet possible. Baidu ne se concentre pas exclusivement sur l’IA conversationnelle et générative, mais a également investi dans d’autres technologies de l’IA telles que la conduite autonome avec sa plateforme Apollo, en partenariat avec une quarantaine de constructeurs automobiles renommés. Baidu propose également des services d’IA sur le cloud en fournissant des solutions d’IA modulaire sur leurs infrastructures de calcul, en utilisant en particulier ses processeurs et accélérateurs IA développés par sa filiale Kunlun Technology. En outre, Baidu a ouvert PaddlePaddle, une plateforme d’apprentissage en profondeur (Deep Learning) en open source, utilisée par une communauté de près de 5 millions de développeurs, où sont partagés de nombreux modèles d’IA pré-entraînés. Grâce à ses atouts, la Chine domine certains sous-domaines de l’IA, tels que la reconnaissance faciale et la vision par ordinateur, où elle excelle, ainsi que sur le traitement du langage naturel (NLP) pour le chinois, et l’apprentissage automatique pour l’analyse de données et le commerce électronique, où la Chine est très compétente. Selon le rapport annuel de l’A.I. Index 2022 de l’Université Stanford, la Chine est en tête en termes de nombre de publications en IA dans les journaux et les conférences, ainsi que de demandes de brevets. Cependant, en ce qui concerne les brevets accordés, la Chine est encore en retard par rapport aux États-Unis, tout comme en termes de qualité des publications. See Also [Les hommes de Xi] Wang Huning, l’idéologue en chef Après tous les investissements et des annonces clinquantes concernant l’intelligence artificielle chinoise, on peut se demander pourquoi aucun acteur chinois n’a été le premier à surprendre le monde avec un ChatGPT. ChatGPT : un revers temporaire ou définitif pour les ambitions en IA de la Chine ? Plusieurs facteurs expliquent pourquoi les Chinois n’ont pas été les premiers à développer un produit aussi mature que ChatGPT. Tout d’abord, en examinant les différentes entreprises d’IA en Chine, on constate que la priorité est accordée aux applications liées à la défense, à la sécurité et au maintien de l’ordre public, reléguant ainsi au second plan les efforts de recherche sur l’IA conversationnelle à domaine ouvert. Ensuite, les modèles génératifs présentent une complexité technique et de gouvernance particulière, étant moins réguliers et prévisibles que les logiciels classiques. Ces modèles nécessitent donc une vérification minutieuse et un entraînement long pour respecter les normes éthiques et morales du pays, un point sur lequel la Chine ne tolérera pas d’écart. Les IA génératives et les robots conversationnels devront suivre la ligne politique officielle, à la manière de l’internet chinois au sein du Great Firewall. Une IA s’engageant dans une diatribe critique à l’encontre du Parti communiste est inenvisageable et signifierait une faillite de l’entreprise. Cette pression pèse sur les entrepreneurs chinois, limitant l’innovation dans l’IA générative par crainte de sanctions des autorités. La presse chinoise a rapidement mis en garde contre les biais de ChatGPT susceptibles de conduire à la désinformation et réclame une réglementation plus stricte. De plus, la performance réelle de ces modèles chinois reste largement méconnue. Un facteur social est également à prendre en compte, car les IA génératives ont le potentiel de remplacer l’humain dans un certain nombre de tâches basiques ou répétitives, ce qui pourrait amener les entreprises à supprimer de nombreux postes. Pour concilier croissance économique et maintien de l’emploi, le gouvernement chinois devra être vigilant quant au déploiement de l’IA dans certains secteurs. Contrairement aux pays occidentaux, la Chine pourrait être moins encline à rechercher des gains de productivité afin d’éviter d’aggraver le chômage des jeunes diplômés. Depuis quelques semaines, cette préoccupation est d’ailleurs relayée sur les réseaux sociaux chinois. Cependant, Mingke Luo, PDG et fondateur de MRS.ai, une entreprise chinoise spécialisée en intelligence artificielle, suggère que « ce qui a peut-être le plus fait défaut, c’est l’état d’esprit des chercheurs d’OpenAI : 300 scientifiques animés d’une vision et d’un désir de faire progresser l’IA générative, travaillant loin des contraintes économiques des investisseurs et de leur recherche de profits à court terme ». Pour cet expert en IA basé à Shanghai : « le caractère non lucratif du projet a été un atout pour permettre à ces chercheurs de dépasser leurs limites ». Aussi, il semble qu’avec la reprise en main des acteurs technologiques privés, la Chine n’ait pas encore élaboré une vision avant-gardiste de l’utilisation de l’IA générative. Les États-Unis paraissent plus aptes à exploiter pleinement le potentiel de cette technologie et exercer une influence mondiale. Cela amènera les entreprises américaines à mieux monétiser l’IA et à davantage attirer les meilleurs talents mondiaux, comme elles le font déjà. Enfin, l’obstacle majeur auquel la Chine doit faire face est l’accès limité aux meilleures capacités de calcul, conséquence des restrictions américaines concernant l’achat de puces d’IA américaines, ainsi que la conception et la fabrication de semi-conducteurs les plus avancés. Les États-Unis visent à limiter la capacité des entreprises technologiques chinoises à créer de grands réseaux de neurones en bloquant l’accès aux puces de calcul haut de gamme. Bien que la plupart des start-ups chinoises spécialisées dans l’IA se concentrent sur l’application et n’aient pas besoin de semi-conducteurs hautes performances pour gérer des données en masse, celles qui effectuent des recherches fondamentales risquent de rencontrer des difficultés en utilisant des puces moins puissantes qui ralentissent le processus de calcul et augmentent les coûts. Les sanctions technologiques américaines soulèvent des inquiétudes quant à la capacité de la Chine à suivre les progrès de l’IA. Malgré les réserves de puces constituées par la Chine pour ses fermes de serveurs, il est inévitable qu’à un moment donné, la Chine sera désavantagée en termes de puissance de calcul, ce qui aura un impact sur les projets d’IA en Chine. Conclusion Les pays qui ne misent pas sur l’intelligence artificielle seront autant déclassés que les pays du 19e siècle qui n’ont pas embrassé la révolution industrielle. Il s’agit donc d’un enjeu majeur de souveraineté. La Chine se trouve définitivement dans le bon wagon avec les États-Unis. La différence se fera sur leur capacité respective à attirer les meilleurs talents, à libérer le potentiel d’innovation du secteur privé et à proposer un projet sociétal d’utilisation de l’IA bénéfique et durable. Aussi fulgurant que colossal, le bond technologique des IA génératives et des robots conversationnels suscite à la fois enthousiasme et inquiétude. Bien qu’il faille attendre encore un certain temps pour apercevoir son impact sur les économies et les sociétés, la course est lancée, stimulée par la rivalité entre puissances. Le 14 mars 2023, OpenAI dévoile déjà un modèle amélioré, le GPT-4, qui dispose de cent fois plus de paramètres que le GPT-3. La Chine peine à démontrer des résultats probants, mais elle n’a peut-être pas encore dévoilé toutes ses cartes. La compétition dans le domaine de l’IA dépendra grandement de la capacité de chaque pays à maîtriser les puces haute performance et les infrastructures de calcul nécessaires. Les pionniers de l’IA pourront influencer les normes de régulation des algorithmes d’IA. La Chine a déjà pris des mesures avec le Cyberspace Administration of China (CAC). L’Europe prépare un projet de loi sur l’intelligence artificielle, l’AI Act, pour établir un cadre juridique pour l’IA, la régulation des algorithmes et une éthique de l’IA, dans l’espoir d’établir une norme mondiale. Des systèmes de régulation vont être mis en place, cependant cela pourrait conduire au développement de modèles spécifiquement entraînés pour certaines régions sur lesquels des applications seront développées, accentuant les découplages de l’information et des technologies. A l’échelle internationale, les grandes puissances de l’IA vont assurément rivaliser d’influence pour diffuser leur propre vision de l’intelligence artificielle.