인공언어의 역사가 가르쳐준 것, 그리고 AI 시대의 인공언어가 다른 길을 가는 이유
1887년의 꿈
1887년, 폴란드의 안과의사 루도비코 자멘호프는 인류를 위한 공통어를 발표했다.
에스페란토.
자멘호프의 문제의식은 명확했다. 민족마다 다른 언어를 쓰기 때문에 오해가 생기고, 오해가 갈등을 낳고, 갈등이 전쟁을 낳는다. 모든 인간이 하나의 언어를 공유하면 세계 평화에 가까워질 것이다.
에스페란토는 아름답게 설계되었다. 문법은 16개 규칙으로 완결된다. 예외가 없다. 어근은 유럽 주요 언어에서 가져와 학습이 쉽다. 발음은 표기와 일치한다.
자멘호프는 자연어의 비효율을 인식하고 의도적으로 설계된 인공언어로 해결하려 했다.
137년이 지난 지금, 에스페란토 사용자는 약 200만 명이다. 세계 인구의 0.025%. 에스페란토는 실패했다.
왜?
실패의 세 가지 원인
원인 1: 배워야 한다
에스페란토가 아무리 쉬워도, 새로운 언어를 배우는 것은 비용이다.
16개 규칙을 익혀야 한다. 어근을 외워야 한다. 그 언어로 생각하고 작문하는 연습이 필요하다.
한국인이 에스페란토를 배우는 데 100시간이 걸린다고 하자. 100시간은 적은 시간이 아니다. 100시간을 투자할 동기가 있으려면, 에스페란토로 소통할 상대가 이미 있어야 한다.
그런데 에스페란토를 쓰는 사람이 적다. 적으니까 배울 동기가 없고, 배우는 사람이 없으니 쓰는 사람이 더 적어진다.
전형적인 네트워크 효과의 역방향. 치킨-앤-에그 문제. 에스페란토는 이 함정에서 137년째 빠져나오지 못하고 있다.
원인 2: 기존 언어를 대체해야 한다
에스페란토의 목표는 기존 자연어를 보조하거나 대체하는 것이었다.
이것은 인류 전체의 습관을 바꾸는 일이다. 영어가 이미 국제 공용어 역할을 하고 있는 상황에서, 새로운 언어를 도입하려면 모든 참여자가 동시에 전환해야 한다.
한 사람이 에스페란토를 배워도, 상대방이 영어로 답하면 의미가 없다. 전환은 동시에 일어나야 하고, 동시 전환은 거의 불가능하다.
원인 3: 소통 자체가 목적이다
에스페란토의 존재 이유는 소통이다. 사람과 사람이 에스페란토로 대화하는 것. 편지를 쓰고, 책을 읽고, 토론하는 것.
그런데 인간은 이미 소통하고 있다. 모국어로, 영어로, 몸짓으로. 불완전하지만 작동한다.
“더 나은 소통"은 매력적이지만, “이미 되는 소통"을 버리고 갈아타기에는 동기가 부족하다.
AI 시대의 인공언어는 이 세 가지를 피할 수 있다
AI를 위한 인공언어가 있다면, 에스페란토와 거의 모든 면에서 다를 것이다.
차이 1: 배울 필요가 없다
에스페란토는 인간이 직접 사용하는 언어다. 이런 언어의 1차 사용자는 AI다.
이런 언어는 AI 내부에서 작동하는 중간 표현(IR)이다. 사용자는 자연어로 말하고, 자연어로 답을 받는다. 그 사이에서 보이지 않게 작동한다.
LLVM IR을 모르는 프로그래머가 C++을 쓰듯, 이 언어를 모르는 사용자가 AI를 쓴다.
배움의 비용이 0이다. 네트워크 효과 문제가 발생하지 않는다. 사용자 한 명도 전환할 필요가 없다.
차이 2: 기존 언어를 대체하지 않는다
에스페란토는 자연어의 자리를 넘봤다. 이런 언어는 자연어의 자리에 관심이 없다.
인간은 계속 자연어로 말한다. 한국어로, 영어로, 스페인어로. 대체하는 것은 자연어가 아니라, AI 내부에서 자연어가 임시로 맡고 있던 역할이다.
추론의 매개체. 지식의 저장 형식. 시스템 간 통신의 프로토콜.
이 역할에서 자연어를 걷어내고 구조화된 언어를 넣는 것이다. 인간의 습관은 아무것도 바뀌지 않는다.
차이 3: 소통이 목적이 아니다
에스페란토의 목적은 소통이다. 이런 언어의 목적은 기록과 검증이다.
AI의 추론을 구조화해서 기록하고, 그 기록을 재사용 가능하게 만들고, 인간이 그 기록을 검증할 수 있게 만드는 것.
소통은 자연어가 맡는다. 이미 잘하고 있다. 이런 언어가 맡는 것은 자연어가 못 하는 것들이다.
그런데 인간은 이 언어를 볼 수 있다
여기서 한 가지 중요한 차이가 있다.
이 언어가 “보이지 않는 중간 언어"라고 해서, 인간이 절대 볼 수 없다는 뜻은 아니다.
이런 언어는 시각적 편집기를 통해 인간에게 열려야 한다.
AI가 내린 판단의 근거를 알고 싶을 때, 추론 그래프를 직접 열어볼 수 있다.
16비트 워드의 바이너리를 읽는 것이 아니다. 그래프가 시각화되어 있다. 노드를 클릭하면 엔티티의 정보가 나온다. 엣지를 따라가면 추론의 경로가 보인다. 출처, 시점, 확신도가 시각적으로 표시된다.
이것은 언어를 배우는 것이 아니다. 지도를 보는 것이다.
구글 맵을 읽기 위해 측량학을 배울 필요가 없듯, 시각적 편집기를 사용하기 위해 바이너리 문법을 배울 필요가 없다.
검증의 인터페이스
Visual Editor는 화이트박스 원칙을 완성하는 마지막 조각이다.
추론이 투명하게 기록된다고 해도, 인간이 그 기록에 접근할 수 없으면 투명함의 의미가 없다.
Visual Editor가 있으면:
AI가 “이순신은 12척의 배로 133척을 물리쳤습니다"라고 답했을 때, 사용자는 그 답변의 추론 그래프를 열어볼 수 있다.
어떤 엔티티가 참조되었는가. 이순신, 명량해전, 조선 수군. 어떤 출처에서 이 정보가 왔는가. 조선왕조실록, 난중일기, 학술 논문. 12척이라는 숫자의 확신도는 얼마인가. 133척은 어디서 왔는가. 일본측 기록과 조선측 기록이 다른가.
사용자는 이것을 보고 판단한다. “이 답변을 신뢰할 수 있는가?”
이것이 맹신(Blind Belief)이 아닌 비판적 신뢰(Critical Trust)다.
에스페란토가 꿈꾼 것은 “모든 인간이 같은 언어로 소통하는 세계"였다. 이런 언어가 만드는 것은 “인간이 AI의 판단을 직접 검증할 수 있는 세계"다.
에스페란토에서 배운 것
에스페란토의 실패는 에스페란토가 나쁜 언어여서가 아니다. 에스페란토는 훌륭한 언어다. 설계는 우아하고 논리적이다.
실패한 것은 전략이다.
인간에게 새로운 언어를 배우라고 요구한 것. 기존 언어의 자리를 대체하려 한 것. 모든 참여자의 동시 전환을 전제한 것.
AI 시대의 인공언어는 이 교훈을 정확히 반영해야 한다.
| 에스페란토 | AI 내부 언어 | |
|---|---|---|
| 1차 사용자 | 인간 | AI |
| 학습 필요 | 있음 | 없음 |
| 기존 언어 대체 | 시도함 | 안 함 |
| 인간의 접근 | 배워서 읽기 | Visual Editor로 보기 |
| 목적 | 소통 | 기록과 검증 |
| 전환 비용 | 모든 참여자 | AI 시스템만 |
에스페란토는 인간의 언어 장벽을 허물려 했다. AI 시대의 인공언어는 인간과 AI 사이의 투명성 장벽을 허문다.
목적이 다르고, 전략이 다르고, 그래서 에스페란토가 빠진 함정을 피한다.
요약
에스페란토는 세 가지 이유로 실패했다.
- 배워야 했다. 네트워크 효과의 함정에 빠졌다.
- 기존 언어를 대체하려 했다. 동시 전환은 불가능했다.
- 소통이 목적이었다. 이미 되는 소통을 갈아탈 동기가 없었다.
AI 시대의 인공언어는 이 세 함정을 모두 피할 수 있다.
- 1차 사용자가 AI이므로 인간이 배울 필요가 없다.
- 자연어를 대체하지 않는다. AI 내부의 역할만 맡는다.
- 소통이 아니라 기록과 검증이 목적이다.
그리고 인간은 시각적 편집기를 통해 AI의 추론을 직접 볼 수 있다. 언어를 배우지 않아도. 지도를 읽듯이.
에스페란토가 가르쳐준 것: 인공언어의 성패는 설계의 우아함이 아니라 전략에 달려 있다.