« Les données à l’Ouest, le calcul à l’Est » : quand la Chine réorganise ses centres de données
L’informatique haute performance (high performance computing – HPC) et plus généralement l’industrie du cloud est, en Chine comme ailleurs, un enjeu économique, technologique et une question de souveraineté. Les États-Unis ont publié le rapport « Pioneering the Future Advanced Computing Ecosystem » en novembre 2020, qui considère le cloud et le HPC comme des atouts stratégiques nationaux pour assurer le leadership des États-Unis en matière de sciences et d’ingénierie, de compétitivité économique et de sécurité nationale. L’Union européenne n’est pas en reste, avec un plan d’action commun lancé en 2018 et un investissement de 8 milliards d’euros annoncé en 2020. Ces derniers jours, le ministre des Armées a officiellement inauguré le nouveau supercalculateur EXA1, dont la puissance se classe parmi le top 10 mondial.
La concurrence mondiale en matière de puissance de calcul est féroce. En termes de puissance de calcul, les États-Unis, la Chine, l’Europe et le Japon représentent respectivement 36 %, 31 %, 11 % et 6 % de la puissance informatique mondiale. Mais la Chine met les bouchées doubles. Au cours de la période du treizième plan quinquennal (2016-2020), la puissance de calcul globale de la Chine a connu une croissance rapide. Cette croissance se mesure par le nombre de racks (de serveurs) des centres de données, le nombre de serveurs “polyvalents”, le nombre de serveurs dédiés à l’IA et le nombre de superordinateurs. Les performances des équipements ont également progressé. En 2020, la puissance de calcul de la Chine a atteint 135 EFlops, représentant environ 31% de la part mondiale, maintenant un taux de croissance élevé de 55%, soit environ 16 points de pourcentage de plus que le taux de croissance mondial.
Pékin compte bien continuer à développer cette industrie vitale pour son effort technologique, industriel et économique. Le 14e plan quinquennal (2021-2025) prévoit un renforcement des capacités de calcul haute performance et de l’industrie du cloud. En 2020, le plan de relance du gouvernement face à l’épidémie de la COVID-19 inclut notamment un soutien aux “nouvelles infrastructures”, c’est-à-dire les équipements de télécommunications, mais aussi les centres de données et calcul haute performance Enfin, le gouvernement travaille désormais depuis un an et demi à l’élaboration d’un grand plan informatique, mené de front par la Commission pour le Développement et les Réformes (NDRC), le puissant gendarme du cyberespace chinois, la Cyberspace Administration of China, le Ministère de l’industrie et le Département de l’énergie.
Cette initiative prend forme en 2021 avec le “plan de mise en œuvre d’un centre national intégré de données massives combiné d’un système algorithmique innovant” (National Integrated Big centre de données) 全国一体化大数据中心协同创新体系算力枢纽实施方案》(发改高技〔2021〕709号. Ce plan au titre indigeste reçoit heureusement un surnom “dongshu xisuan” (东数西算) pour “à l’est, les données, à l’ouest, le calcul”.
[/vc_column_text][vc_empty_space height= »18px »][thb_title style= »style7″ title= »La théorie »][vc_empty_space height= »18px »][vc_column_text]L’idée évoquée par cette abréviation est la suivante : la majorité de la donnée créée par les applications numériques émane de l’Est : Beijing, Tianjin, Shanghai, Zhejiang, Jiangsu ou encore le Guangdong. En effet, c’est là où se situe l’essentiel de la population connectée à internet, mais aussi les applications industrielles ou administratives. Dans ces provinces côtières toutefois, l’électricité est chère, ce qui représente un coût important dans la maintenance des centres de données. L’Ouest (Inner Mongolia, Gansu, Guizhou) d’abondantes sources d’électricité à bas coût. L’objectif est donc de créer un maillage territorial de centre de données, avec, pour simplifier, des centres de calcul à l’Ouest et des centres de données à l’Est du pays.Concrètement, le projet se matérialise par la construction de huit interconnexions et dix clusters de centres de calcul planifiés à l’échelle nationale. Par interconnexion, le texte entend établir des centres de données dédiés aux transferts de données à grande échelle entre les centres de l’Est et ceux de l’Ouest. L’état ne semble pas directement être chargé de la construction et l’opération des centres de données mais procède à la désignation de “zones” pour l’établissement de ceux-ci par des entreprises privées. Ce procédé permet de concentrer les centres de données et ainsi réduire la latence (le temps entre une requête par un utilisateur et la réponse du serveur). [/vc_column_text][vc_empty_space height= »8px »][thb_image alignment= »aligncenter » image= »23141″]
Cette première carte explicite la situation de déséquilibre entre la position des “besoins en calcul” (en bleu) et les zones qui disposent d’un excès de ressources;
[/thb_image][vc_empty_space height= »18px »][thb_image alignment= »aligncenter » image= »23139″]Une autre carte qui reprend l’architecture du programme avec la position approximative des interconnexions (en jaune) et des “clusters” de calcul (en bleu).
[/thb_image][vc_empty_space height= »18px »][thb_title style= »style6″ title= »La pratique »][vc_empty_space height= »18px »][vc_column_text]En pratique, la construction de ces centres de données représente un investissement colossal, de l’ordre de plusieurs milliards voire dizaines de milliards d’euros. Cette somme est en partie procurée par l’Etat central ou les gouvernements locaux dans le cadre des plans d’investissements décidés dans la foulée de l’épidémie de COVID 2019. En particulier, on pense au plan pour les nouvelles infrastructures dont les centres de données font justement partie. Le développement de l’industrie du cloud et du calcul sont en outre des priorités du plan quinquennal décidé en 2021.
L’investissement est d’autant plus important que les objectifs du plan dongshu xisuan doivent être en ligne avec ceux de la neutralité carbone. Or, un centre de données est énergivore. On mesure le coût en énergie d’un centre de données avec l’échelle “PUE” : un indicateur d’efficacité énergétique, à savoir le rapport entre l’énergie totale consommée par le centre informatique rapporté à l’énergie totale consommée par les équipements informatiques. Le but est d’obtenir un rapport autour de 1,00, que le centre de données ne consomme pas plus que l’énergie de ses équipements. Les meilleurs centres de données atteignent aujourd’hui un PUE de 1.09 (pour OVH), Google est passé en dix ans de 2.5 à 1.19. Dans le cadre du plan dongshu xisuan, l’objectif est de construire des centres respectant 1.20 dans les provinces de l’Ouest et 1.25 à l’Est.
La faisabilité du projet, cependant, interroge. Sur le papier en effet, l’idée est séduisante : les centres de données les plus gourmands seront plus proches de sources d’énergie renouvelable. Mais les critiques s’inquiètent d’une part du risque du temps de latence qui pourrait être important, surtout si les efforts en termes d’infrastructure de communication (fibre optique notamment). De même, il est plus facile de dépêcher des équipes et trouver du personnel formé à ces technologies à Pékin que dans les steppes de Mongolie intérieure. Enfin, pour ces raisons de connectivité et facilité d’interventions, il est probable que des entreprises clientes cherchent tout de même à faire appels à des centres situés à Pékin ou Shanghai, puis qu’en cas de problème on est certain d’une réponse rapide.
Pour conclure donc, le projet dongshu xisuan est un nouvel exemple de planification centrale chinoise. Le centre décide, tandis que les entreprises d’état, collectivités et entreprises privées répondent à des incitations et investissent des sommes colossales dans sa réalisation. Bien que le plan fasse l’objet de critiques, il sera probablement mené à son terme si bien que des résultats pourront être revendiqués par toutes les parties prenantes. Reste à savoir si les capacités de calcul ainsi construites permettront de mieux répartir les besoins en puissance de calcul tout en gardant l’indice énergétique à des taux convenables.
[/vc_column_text][vc_empty_space height= »16px »]