La fabrication de puces à Taïwan domine le monde, mais après que des centres d’évaluation de l’IA ont testé plus de 100 grands modèles de langage, la conclusion est un peu gênante : ces modèles comprennent très mal la société taïwanaise. Les autorités compétentes ont présenté aujourd’hui l’état d’avancement actuel de la base de données gouvernementale et ont fait une déclaration sur la création d’une « IA souveraine ».
(Contexte : Trump publie le « cadre législatif national en matière d’IA » ! Mise en avant d’une réglementation fédérale unique, protection ferme de la suprématie de l’IA américaine)
(Complément de contexte : Huang Renxun annonce l’incursion de NVIDIA dans le calcul de puissance spatial : Vera Rubin Space-1 pour construire un centre de données en orbite)
Le centre d’évaluation de l’IA de Taïwan (AIEC) a déjà testé, à ce jour, plus de 100 grands modèles de langage. L’un des projets de test consistait à mesurer à quel point ces modèles comprennent la société taïwanaise : le résultat n’est pas encourageant. Les modèles d’IA dominants actuels reposent pour la plupart sur des données en anglais ; dans le contexte local de Taïwan, les pratiques en matière de réglementation et le cadre culturel, il n’y a presque « rien » — c’est « ils ne savent pas ».
Aujourd’hui (1), le président de la Commission nationale des sciences et technologies, Wu Cheng-wen, a déclaré directement lors de la cérémonie de remise des prix pour l’ouverture des données gouvernementales de l’an 114 : « Même si l’on dispose de puces avancées et d’une puissance de calcul puissante, sans des données de haute qualité, les bénéfices de l’IA restent limités. » Il qualifie les données gouvernementales d’actifs stratégiques clés : elles permettent aux citoyens et à l’ensemble des grands modèles du monde d’obtenir la capacité d’exploiter les données taïwanaises.
Wu Cheng-wen a également lancé l’idée que Taïwan est actuellement en train de mettre en place activement une « IA souveraine ». En plus de construire des centres de données, le ministère du Numérique (數發部) travaille actuellement, avec d’autres ministères et organismes, à promouvoir des corpus pour entraîner l’IA souveraine de Taïwan.
Les autorités taïwanaises ont lancé fin 2025 le plan « Taiwan Sovereign AI Training Corpus » (corpus d’entraînement pour une IA souveraine à Taïwan). Ce projet s’étend sur plusieurs organismes et collecte des données gouvernementales ; les entités qui utilisent les données ne se limitent pas au programme local TAIDE : Google et d’autres entreprises internationales du secteur Internet figurent aussi sur la liste.
Aujourd’hui, le directeur du ministère du Développement numérique, Lin Yi-jing, a expliqué sur place que l’ouverture des données se fait en parallèle selon deux grandes catégories. La première concerne les services aux citoyens : par exemple, des données en temps réel sur les stations YouBike, l’ouverture d’informations météo, afin que diverses applications et services puissent les utiliser directement. La deuxième catégorie vise à intégrer les données dans les modèles de référence, afin que les modèles d’IA comprennent réellement les habitudes linguistiques de Taïwan, le cadre juridique et le contexte social, au lieu de considérer Taïwan comme une « autre région géographique » marginalisée.
Conformément à la loi fondamentale sur l’IA, le Yuan exécutif mettra en place une « Commission spéciale stratégique nationale sur l’intelligence artificielle » comme mécanisme d’accompagnement. Elle est actuellement en cours de constitution, la première réunion devant se tenir d’ici 2026. La mission de cette commission consiste à assurer la coordination inter-ministérielle : permettre que l’ouverture des données, l’évaluation des modèles et le déploiement de la puissance de calcul fonctionnent dans le même cadre.
Cependant, la phase prototype de la « IA souveraine » à Taïwan, nous ne l’avons pas encore vue : s’agit-il de grands modèles développés en interne et publiés pour être utilisés, ou bien du recours aux services de grands fournisseurs de modèles pour soutenir le tout ? On attend les mises à jour à venir.