人工语言的历史教给了我们什么,以及为什么AI时代的人工语言走了一条不同的路
1887年的梦想
1887年,一位名叫柴门霍夫的波兰眼科医生 发布了一种面向全人类的共通语言。
世界语。
柴门霍夫的诊断很明确。 因为每个国家说不同的语言,所以产生误解。 误解滋生冲突,冲突滋生战争。 如果所有人共享一种语言, 世界就会更接近和平。
世界语设计得很优美。 它的语法仅用16条规则就能完整表达。没有例外。 它的词根取自主要欧洲语言,易于学习。 发音与拼写一致。
柴门霍夫认识到了自然语言的低效, 并试图用一种精心设计的人工语言来解决它。
137年后,世界语大约有200万使用者。 占世界人口的0.025%。 世界语失败了。
为什么?
失败的三个原因
原因一:必须学习它
无论世界语多么简单,学习一门新语言都是成本。
必须掌握16条规则。 必须记忆词根。 需要练习用这种语言思考和写作。
假设一个韩语母语者需要100小时学习世界语。 100小时不是小数目。 要有动力投入100小时, 必须已经有人可以用世界语交流。
但说世界语的人很少。 因为说的人少,就没有学习的动力。 因为没人学,说的人就更少。
典型的反向网络效应。 鸡与蛋的问题。 世界语在这个陷阱中困了137年。
原因二:它必须取代现有语言
世界语的目标是补充或取代现有的自然语言。
这意味着要改变全人类的习惯。 在英语已经充当国际通用语的情况下, 引入一种新语言需要所有参与者同时切换。
即使一个人学了世界语, 如果对方用英语回应,那也没有意义。 切换必须同时发生, 而同时切换几乎不可能。
原因三:沟通本身就是目的
世界语存在的理由就是沟通。 人们用世界语交谈。 写信、读书、辩论。
但人类已经在沟通了。 用母语、用英语、用手势。 不完美,但管用。
“更好的沟通"很有吸引力, 但放弃"已经管用的沟通"的动力不足。
AI时代的人工语言可以避开这三个陷阱
如果存在一种为AI设计的人工语言, 它几乎在每个方面都与世界语不同。
差异一:不需要学习
世界语是人类直接使用的语言。 这类语言的主要用户是AI。
这类语言是在AI内部运行的中间表示(IR)。 用户用自然语言说话,用自然语言接收回答。 它在中间不可见地运行。
就像一个对LLVM IR一无所知的程序员也能写C++, 一个对这种语言一无所知的用户也能使用AI。
学习成本为零。 网络效应问题不会出现。 没有任何一个用户需要切换。
差异二:它不取代现有语言
世界语觊觎自然语言的位置。 这类语言对那个位置毫无兴趣。
人类继续说自然语言。 说韩语、说英语、说西班牙语。 它取代的不是自然语言, 而是自然语言在AI内部临时充当的角色。
推理的媒介。 知识的存储格式。 系统间通信的协议。
它将自然语言从这个角色中移除,插入一种结构化语言。 人类的习惯不会有任何改变。
差异三:沟通不是目的
世界语的目的是沟通。 这类语言的目的是记录和验证。
将AI的推理结构化并记录下来。 使那份记录可复用。 使人类能够验证那份记录。
沟通是自然语言的工作。它已经做得很好。 这类语言处理的是自然语言无法做到的事情。
但人类可以看到这种语言
这里有一个重要的区别。
仅仅因为这种语言是"不可见的中间语言” 并不意味着人类永远看不到它。
这类语言应该通过可视化编辑器向人类开放。
当你想知道AI做出某个判断的依据时, 可以直接打开推理图。
你不是在阅读二进制16位字。 图是可视化的。 点击一个节点,实体的信息就会出现。 沿着一条边走,推理路径就变得可见。 来源、时间戳和置信度都以可视化方式呈现。
这不是学习一门语言。 这是阅读一张地图。
就像你不需要学习测量学就能看谷歌地图, 你也不需要学习二进制语法就能使用可视化编辑器。
验证的界面
可视化编辑器是完成白盒原则的最后一块拼图。
即使推理被透明地记录下来, 如果人类无法访问那份记录,透明也毫无意义。
有了可视化编辑器:
当AI回答"李舜臣以12艘船击败了133艘船"时, 用户可以打开那个回答背后的推理图。
引用了哪些实体?李舜臣、鸣梁海战、朝鲜水军。 这些信息来自什么来源?朝鲜王朝实录、乱中日记、学术论文。 数字12的置信度是多少? 133是从哪里来的?日本记录和韩国记录是否不一致?
用户看了这些之后判断: “我能信任这个回答吗?”
这是批判性信任,不是盲目相信。
世界语的梦想是"所有人用同一种语言沟通的世界"。 这类语言创造的是"人类可以直接验证AI判断的世界"。
世界语教给我们的
世界语的失败不是因为它是一门糟糕的语言。 世界语是一门优秀的语言。它的设计优雅而有逻辑。
失败的是策略。
要求人类学习一门新语言。 试图取代现有语言的位置。 假设所有参与者会同时切换。
AI时代的人工语言必须精确地反映这些教训。
| 世界语 | AI内部语言 | |
|---|---|---|
| 主要用户 | 人类 | AI |
| 需要学习 | 是 | 否 |
| 取代现有语言 | 试图了 | 不会 |
| 人类访问 | 学习后阅读 | 通过可视化编辑器查看 |
| 目的 | 沟通 | 记录和验证 |
| 切换成本 | 所有参与者 | 仅AI系统 |
世界语试图拆除人类之间的语言壁垒。 AI时代的人工语言拆除的是人类与AI之间的透明度壁垒。
目的不同,策略不同, 所以它能避开世界语陷入的陷阱。
总结
世界语因三个原因而失败。
- 必须学习它。陷入了网络效应陷阱。
- 试图取代现有语言。同时切换是不可能的。
- 沟通是目的。没有动力从已经管用的沟通方式切换。
AI时代的人工语言可以避开这三个陷阱。
- 主要用户是AI,所以人类不需要学习。
- 不取代自然语言。只处理AI内部的角色。
- 目的不是沟通,而是记录和验证。
而且人类可以通过可视化编辑器直接看到AI的推理。 不需要学习这门语言。就像读地图一样。
世界语教给我们的: 人工语言的成败不取决于设计的优雅,而取决于策略。