Informatique : il y a un demi-siècle, ce prisonnier a codé toute la langue chinoise

caractères chinois
Crédits : quillau / Pixabay

Zhi Bingyi était un prisonnier politique chinois, mais aussi un scientifique de renom. Son fait d’armes le plus célèbre est le codage de la langue chinoise pour une utilisation dans les systèmes informatiques, une avancée majeure en Chine à la fin des années 1970.

Une solution pour numériser les caractères chinois

Zhi Bingyi (1911-1993) fut jeté en prison par le régime de Mao Zedong. Selon les autorités, ce scientifique était un intellectuel réactionnaire. Avant son incarcération, il avait décroché un doctorat en sciences physiques à l’Université de Leipzig (Allemagne) avant de refuser une offre d’emploi provenant des États-Unis. Comme l’expliquait Wired dans un article du 23 janvier 2022, Zhi Bingyi désirait en effet retourner en Chine pour y assurer un poste d’enseignant-chercheur. Emprisonné en 1968, l’homme coupé du monde n’eut aucun accès aux informations et ne put pas poursuivre ses recherches.

Dans sa cellule au confort rudimentaire, Zhi Bingyi était livré à lui-même, faisant face à une phrase en chinois écrite sur un des murs : « La clémence à ceux qui avouent, la sévérité pour ceux qui refusent. » Au fil des jours et des semaines, le chercheur, qui fixait sans cesse cette phrase, en développa une vision différente, sous la forme de points et de traits. Son idée ? Élaborer un système de transcription de la langue permettant de numériser les caractères.

Une série de lettres pour chaque caractère

Le géographe et linguiste français Stanislas d’Escayrac de Lauture (1826-1868) avait déjà tenté de s’intéresser aux caractères chinois dans un but de transcription. Néanmoins, bien qu’intéressantes à l’époque, ses techniques ne répondaient pas aux besoins naissants du domaine de l’informatique. Or, la Chine des années 1970 était face à un dilemme que Zhi Bingyi allait finir par solutionner. Le pays se devait en effet d’avoir un système informatique fiable dans les domaines aérien, militaire et industriel. Il s’agissait également de ne pas abandonner le mandarin au profit de l’anglais.

Zhi Bingyi élabora alors tout simplement un système permettant d’écrire l’intégralité des caractères chinois au moyen d’un clavier en alphabet romain. Le chercheur choisit de coder chaque caractère avec une série de lettres et durant plus d’un an, il utilisa un stylo volé et une tasse à thé en céramique afin d’y coucher ses nombreuses réflexions. Il mémorisait ensuite chaque résultat et effaçait les traces de son travail.

Le scientifique réussit donc à mettre au point sa méthode, se basant à la fois sur la phonétique et sur la structure géographique des caractères. Ce double système permettait de contourner les nombreuses difficultés dues à la présence de nombreux homophones dans la langue. Finalement relâché après quatorze mois de prison, Zhi Bingyi occupa ensuite des postes « ingrats » loin de ses capacités intellectuelles. Il mit toutefois ce temps à profit.

Une dizaine d’années de travail supplémentaire pour Zhi Bingyi

L’un de ces postes n’était autre que surveillant d’entrepôt. Dans son bureau, il eut accès à la presse étrangère où il découvrit des avancées encourageantes en matière de transcription de caractères au Japon, en Australie et aux États-Unis. L’homme eut besoin d’une dizaine d’années pour perfectionner son système et mettre au point un code qui évitait au maximum les confusions entre les caractères.

支秉彝 zhi bingyi
Crédits : jiaxiangwang.com

En 1978, il publia son premier article dans la revue Nature. Il y expliquait avoir généré pas moins de 456 976 codes différents, chacun composé de quatre lettres sur les vingt-six de notre alphabet. Or, ces codes permettaient de transcrire la totalité des dizaines de milliers de caractères du mandarin. Ce véritable travail de titan permit finalement à l’écriture chinoise de faire son entrée dans le système informatique.