なぜ GEUL なのか
AI は賢くなった。驚くほどに。
しかし、奇妙なことが起きている。 AI が賢くなればなるほど、AI に見せる情報の質がより重要になる。
考えてみてほしい。 AI に社内文書100ページを渡して「要約して」と言えば、 かなりうまくやる。
しかし、その100ページの中に 3年前の情報と昨日の情報が混ざっていたら? 出典が不明なデータが紛れ込んでいたら? 互いに矛盾する数字があったら?
AI は知らない。 全部読み、全部信じ、全部混ぜて答える。
これは AI のせいではない。 AI に入る情報に出典がなく、時点がなく、確信度がないからだ。 自然言語にはこれらを入れる場所がない。
私はこれが言語の問題だと考えている。
自然言語は人間のために進化した。 人間は文脈がわかる。「最近」がいつか、「あの会社」がどこか、話し手がどれだけ確信しているか。 だから自然言語はこれらを省略しても済む。
AI は文脈がわからない。 「最近」がいつかわからず、「あの会社」がどこかわからず、話し手の確信度を知ることができない。 自然言語が省略したものを、AI は推測する。 当たることもあれば、外れることもある。
プログラミング言語はどうか。 曖昧さがなく正確だ。しかし手続きを記述するものであり、世界を記述するものではない。 Python で「李舜臣は偉大だった」とは書けない。
人間の言語は曖昧だ。 機械の言語は世界を記述できない。 その間に空白がある。
GEUL はその空白を埋めようとする試みだ。
GEUL は AI のために設計された人工言語だ。
すべての記述に出典がある。 すべての記述に時点がある。 すべての記述に確信度がある。 すべてのエンティティに固有の識別子がある。 「サムスン電子」と「Samsung Electronics」が同じものだと機械が知っている。
GEUL で書かれた情報は機械的に検証できる。 形式は正しいか、参照は有効か、互いに矛盾していないか。 AI が読む前に、人間が確認する前に、機械がまず検査する。
これがなぜ重要か。
AI のコンテキストウィンドウは有限だ。 128K トークンでも 1M トークンでも、有限だ。 有限な空間に入る情報の質が、出力の質を決める。 出典のない情報、古い情報、矛盾した情報が入れば、 AI の出力もそれだけ劣化する。
GEUL は AI に入る情報を整理する方法だ。
世宗大王は音を分析し、文字を設計した。 音には体系があり、その体系を反映した文字のほうが優れている、という洞察。
GEUL は似た問いから出発する。 意味にも体系がある。その体系を反映した表現のほうが優れているのではないか。
ただし読者が違う。 ハングル(Hangul)の読者は人間だった。 GEUL の読者は AI だ。
このサイトでは、なぜ GEUL が必要なのかを説明する。 製品を売るわけではない。技術仕様を並べるわけでもない。 「なぜ?」という問いに答える。
なぜ自然言語では足りないのか。 なぜプログラミング言語でも駄目なのか。 なぜコンテキストエンジニアリングという分野が必要なのか。 なぜ AI に見せる情報に構造が必要なのか。
答えが納得できれば、GEUL は自然に見えるだろう。 納得できなければ、GEUL は必要ない。
判断は読む人に委ねる。