AI需要一种新语言

GEUL — 为人类与AI无歧义沟通而设计的语义对齐人工语言

为什么需要人工语言

自然语言为人类通信而进化。模糊性、冗余和暗示对人类是优势,但对AI却是幻觉的根源。编程语言和现有语义表示体系都不是答案。需要一种同时满足六个条件的新人工语言。

为什么自然语言会产生幻觉?

幻觉不是LLM的bug——它是自然语言四大结构性缺陷的必然产物:歧义、来源缺失、置信度缺失、时间缺失。更大的模型无法修复它。

为什么编程语言不够用

编程语言描述过程,无法描述世界。JSON提供结构但没有语义。即使LISP也只是借用了语法。

为什么嵌入向量行不通

重新排列嵌入向量会破坏模型。要避免破坏就必须重建模型。我们需要的不是让黑盒内部变透明,而是在外部构建一个透明层。

为什么选择维基数据

GEUL不否定维基数据,而是将1亿个实体的分类体系和频率统计转化为SIDX码本。在词典之上构建语法。

为什么选择WordNet

从零构建动词体系会遗漏、主观、缺乏依据。WordNet是语言学家40年积累的13,767个动词同义词集数据库。借用词典,自建语法。

为什么注释应该成为索引

注释是为人写的。但当函数多达10,000个时,机器也必须能读。将注释从叙述变为索引,全量扫描就变成了即时检索。

为什么必须留空

GEUL将64位空间的75%留空。IPv4、Unicode、ASCII的教训告诉我们——填满的代价不可逆转,而留空的代价为零。