Ce que l’histoire des langues artificielles nous a enseigne, et pourquoi une langue artificielle pour l’ere de l’IA emprunte un chemin different


Le reve de 1887

En 1887, un ophtalmologiste polonais nomme Ludwik Zamenhof a publie une langue commune pour l’humanite.

L’esperanto.

Le diagnostic de Zamenhof etait clair. Parce que chaque nation parle une langue differente, des malentendus surgissent. Les malentendus engendrent des conflits, et les conflits engendrent des guerres. Si tous les humains partageaient une seule langue, le monde se rapprocherait de la paix.

L’esperanto etait magnifiquement concu. Sa grammaire tient en 16 regles. Aucune exception. Ses racines sont tirees des principales langues europeennes, ce qui le rend facile a apprendre. La prononciation correspond a l’orthographe.

Zamenhof a reconnu l’inefficacite du langage naturel et a tente de la resoudre avec une langue artificielle deliberement concue.

137 ans plus tard, l’esperanto compte environ 2 millions de locuteurs. 0,025% de la population mondiale. L’esperanto a echoue.

Pourquoi ?


Trois causes de l’echec

Cause 1 : Il faut l’apprendre

Aussi facile que soit l’esperanto, apprendre une nouvelle langue est un cout.

Il faut maitriser 16 regles. Il faut memoriser les racines. Il faut s’exercer a penser et ecrire dans cette langue.

Disons qu’un francophone a besoin de 100 heures pour apprendre l’esperanto. 100 heures, ce n’est pas anodin. Pour avoir la motivation d’investir 100 heures, il faut deja avoir quelqu’un avec qui communiquer en esperanto.

Mais peu de gens parlent esperanto. Parce que peu le parlent, il n’y a pas de motivation pour l’apprendre. Parce que personne ne l’apprend, encore moins de gens le parlent.

Un cas d’ecole d’effets de reseau inverses. Le probleme de la poule et de l’oeuf. L’esperanto est pris dans ce piege depuis 137 ans.

Cause 2 : Il devait remplacer les langues existantes

L’objectif de l’esperanto etait de completer ou remplacer les langues naturelles existantes.

Cela signifie changer les habitudes de toute l’humanite. Avec l’anglais servant deja de lingua franca internationale, introduire une nouvelle langue exige que tous les participants basculent simultanement.

Meme si une personne apprend l’esperanto, c’est inutile si l’autre repond en anglais. La bascule doit etre simultanee, et la bascule simultanee est quasiment impossible.

Cause 3 : La communication elle-meme etait le but

La raison d’etre de l’esperanto etait la communication. Des gens conversant entre eux en esperanto. Ecrire des lettres, lire des livres, tenir des debats.

Mais les humains communiquent deja. Dans leurs langues maternelles, en anglais, par gestes. Imparfaitement, mais ca fonctionne.

“Une meilleure communication” est attrayante, mais la motivation pour abandonner “une communication qui fonctionne deja” est insuffisante.


Une langue artificielle pour l’ere de l’IA peut eviter ces trois ecueils

Si une langue artificielle pour l’IA existait, elle differerait de l’esperanto en presque tout.


Difference 1 : Pas besoin de l’apprendre

L’esperanto est une langue que les humains utilisent directement. L’utilisateur principal de ce type de langue est l’IA.

Ce type de langue est une representation intermediaire (IR) qui opere a l’interieur de l’IA. Les utilisateurs parlent en langage naturel et recoivent des reponses en langage naturel. Elle opere de maniere invisible entre les deux.

Tout comme un programmeur qui ne connait rien au LLVM IR peut ecrire en C++, un utilisateur qui ne connait rien a ce langage peut utiliser l’IA.

Le cout d’apprentissage est nul. Le probleme d’effet de reseau ne se pose pas. Pas un seul utilisateur n’a besoin de basculer.


Difference 2 : Elle ne remplace pas les langues existantes

L’esperanto convoitait la position du langage naturel. Ce type de langue n’a aucun interet pour cette position.

Les humains continuent de parler en langage naturel. En francais, en anglais, en espagnol. Ce qu’elle remplace, ce n’est pas le langage naturel, mais le role que le langage naturel remplit temporairement a l’interieur de l’IA.

Le medium du raisonnement. Le format de stockage des connaissances. Le protocole de communication entre systemes.

Elle retire le langage naturel de ce role et insere un langage structure. Rien ne change dans les habitudes humaines.


Difference 3 : La communication n’est pas le but

Le but de l’esperanto etait la communication. Le but de ce type de langue est l’enregistrement et la verification.

Structurer le raisonnement de l’IA et l’enregistrer. Rendre cet enregistrement reutilisable. Permettre aux humains de verifier cet enregistrement.

La communication est le travail du langage naturel. Il le fait deja bien. Ce type de langue gere ce que le langage naturel ne peut pas faire.


Mais les humains peuvent voir ce langage

Il y a une distinction importante ici.

Ce n’est pas parce que ce langage est un “langage intermediaire invisible” que les humains ne peuvent jamais le voir.

Ce type de langue devrait etre accessible aux humains via un editeur visuel.

Quand vous voulez connaitre la base d’un jugement que l’IA a formule, vous pouvez ouvrir le graphe de raisonnement directement.

Vous ne lisez pas des mots binaires de 16 bits. Le graphe est visualise. Cliquez sur un noeud et les informations de l’entite apparaissent. Suivez une arete et le chemin de raisonnement devient visible. Sources, horodatages et niveaux de confiance sont affiches visuellement.

Ce n’est pas apprendre une langue. C’est lire une carte.

Tout comme vous n’avez pas besoin d’etudier la topographie pour lire Google Maps, vous n’avez pas besoin d’apprendre la grammaire binaire pour utiliser l’editeur visuel.


L’interface de verification

L’editeur visuel est la piece finale qui complete le principe de boite blanche.

Meme si le raisonnement est enregistre de maniere transparente, la transparence est sans valeur si les humains ne peuvent pas acceder a cet enregistrement.

Avec un editeur visuel :

Quand l’IA repond “Yi Sun-sin a vaincu 133 navires avec 12 navires”, l’utilisateur peut ouvrir le graphe de raisonnement derriere cette reponse.

Quelles entites ont ete referencees ? Yi Sun-sin, la bataille de Myeongnyang, la marine de Joseon. De quelles sources provient cette information ? Les Annales de la dynastie Joseon, le Nanjung Ilgi, des articles academiques. Quel est le niveau de confiance du nombre 12 ? D’ou vient 133 ? Les archives japonaises et coreennes sont-elles en desaccord ?

L’utilisateur regarde cela et juge : “Puis-je faire confiance a cette reponse ?”

C’est une confiance critique, pas une croyance aveugle.

Ce dont l’esperanto revait, c’etait “un monde ou tous les humains communiquent dans la meme langue”. Ce que ce type de langue cree, c’est “un monde ou les humains peuvent verifier directement les jugements de l’IA”.


Ce que l’esperanto nous a enseigne

L’echec de l’esperanto n’est pas du au fait que c’etait une mauvaise langue. L’esperanto est une langue excellente. Sa conception est elegante et logique.

Ce qui a echoue, c’est la strategie.

Demander aux humains d’apprendre une nouvelle langue. Essayer de remplacer la position des langues existantes. Supposer que tous les participants basculeraient simultanement.

Une langue artificielle pour l’ere de l’IA doit refleter precisement ces lecons.

EsperantoLangue interne de l’IA
Utilisateur principalHumainsIA
Apprentissage requisOuiNon
Remplace les langues existantesA tenteNon
Acces humainApprendre et lireVoir via l’editeur visuel
ButCommunicationEnregistrement et verification
Cout de basculeTous les participantsSystemes d’IA uniquement

L’esperanto a tente d’abattre la barriere linguistique entre les humains. Une langue artificielle pour l’ere de l’IA abat la barriere de transparence entre les humains et l’IA.

Le but est different, la strategie est differente, et c’est pourquoi elle evite le piege dans lequel l’esperanto est tombe.


Resume

L’esperanto a echoue pour trois raisons.

  1. Il fallait l’apprendre. Il est tombe dans le piege de l’effet de reseau.
  2. Il a tente de remplacer les langues existantes. La bascule simultanee etait impossible.
  3. La communication etait le but. Il n’y avait pas de motivation pour abandonner une communication qui fonctionnait deja.

Une langue artificielle pour l’ere de l’IA peut eviter ces trois pieges.

  1. L’utilisateur principal est l’IA, donc les humains n’ont pas besoin de l’apprendre.
  2. Elle ne remplace pas le langage naturel. Elle ne gere que les roles a l’interieur de l’IA.
  3. Le but n’est pas la communication mais l’enregistrement et la verification.

Et les humains peuvent voir le raisonnement de l’IA directement via un editeur visuel. Sans apprendre le langage. Comme s’ils lisaient une carte.

Ce que l’esperanto nous a enseigne : Le succes ou l’echec d’une langue artificielle ne depend pas de l’elegance de sa conception, mais de sa strategie.