Структурированные форматы уже существуют. Так почему нужен новый язык?
Самое частое возражение
Когда кто-то впервые сталкивается с идеей языка рассуждений ИИ, первое, что он говорит:
“Структурированные форматы уже существуют, разве нет?”
Они правы. Существуют. Много.
Есть Markdown. Есть JSON. Есть XML. YAML, TOML, Protocol Buffers, MessagePack, CSV…
Мир переполнен форматами данных. Так почему ИИ по-прежнему думает на естественном языке?
Чтобы ответить на этот вопрос, мы должны точно определить, что каждый формат делает хорошо и чего он не может.
Markdown: текущая память ИИ-агентов
По состоянию на 2026 год, формат, наиболее широко используемый ИИ-агентами, – Markdown.
Claude Code запоминает в файлах .md.
Агенты на основе GPT тоже оставляют заметки в Markdown.
CLAUDE.md, memory.md, notes.md.
Долговременная память ИИ прямо сейчас стоит на Markdown.
Почему Markdown? Причина проста. LLM хорошо читают и пишут Markdown. Markdown обильно представлен в обучающих данных, и его структура достаточно проста для лёгкой генерации и разбора.
Но Markdown – формат документов, предназначенный для чтения людьми.
# Статус проекта
## Стратегия кэширования
- Принята SIMD-битовая маска (решение 1/28)
- GPU-ускорение на рассмотрении
## Нерешённое
- Метод генерации запросов не определён
Как машина это интерпретирует?
Есть заголовок раздела “Стратегия кэширования”. Под ним пункт “Принята SIMD-битовая маска”. Есть дата “(1/28)” в скобках.
Машина не может понять это структурно.
Она может определить по ##, что “Стратегия кэширования” – заголовок раздела,
но семантическая связь “это подтема архитектуры” в Markdown не существует.
Человек знает, что “1/28” – дата, но машина должна угадывать.
28 января или одна двадцать восьмая?
В конечном счёте, чтобы “понять” Markdown, LLM должен выполнить интерпретацию естественного языка. Markdown – это естественный язык с наложенными отступами – а не структурированные данные.
JSON: структура без смысла
JSON идёт на шаг дальше Markdown.
{
"entity": "Ли Сунсин",
"birth": "1545",
"death": "1598",
"occupation": "naval_commander"
}
Есть структура. Пары ключ-значение явные. Машина может разобрать. К полям есть доступ.
Но есть проблема.
JSON не знает, что означает ключ “entity”.
Человек, создавший этот JSON, знает, что “entity” означает “объект”. В JSON другого человека та же концепция может быть “name”, “subject” или “item”.
{"name": "Ли Сунсин"}
{"subject": "Ли Сунсин"}
{"item": "Ли Сунсин"}
{"entity": "Ли Сунсин"}
Четыре JSON выражают одно и то же, но машина не может узнать, что это одно и то же.
JSON лишён разделяемой семантики. Есть структура, но нет договорённости о том, что эта структура означает.
Каждый проект создаёт свою схему. Каждый API использует свои имена полей. Чтобы связать схему A со схемой B, нужен ещё один слой трансформации.
Это Вавилонская башня. Структура есть, но никто не понимает структуру друг друга.
XML: налог многословности
XML попытался решить проблему JSON.
Пространства имён, определения схем (XSD), определения типов документов (DTD). Он предоставляет метаструктуры, определяющие смысл структур.
<entity xmlns="http://example.org/schema">
<name>Ли Сунсин</name>
<birth>
<year>1545</year>
<calendar>lunar</calendar>
</birth>
<death>
<year>1598</year>
<cause>killed_in_action</cause>
</death>
</entity>
Смысл можно определить. Структуру можно принудить через схемы. Он строже JSON.
Но у XML есть фатальная проблема.
Он многословен.
В приведённом XML фактическая информация – “Ли Сунсин, 1545, 1598, killed_in_action.” Всё остальное – теги. Открывающие и закрывающие теги превосходят числом информацию.
Почему это проблема для ИИ?
Контекстное окно LLM конечно. Если для передачи той же информации требуется в 3 раза больше токенов, объём информации, помещающейся в контекст, сокращается до одной трети.
XML многословен, чтобы люди могли легко его читать.
Язык рассуждений ИИ не должен иметь таких потерь.
Для LLM тег <name> – это расточительство.
И XML – проект начала 2000-х. Он был создан в эпоху, когда LLM не существовали, для людей и традиционного ПО. Он никогда не проектировался как язык рассуждений ИИ.
Общее ограничение
Markdown, JSON, XML. У каждого из четырёх форматов есть свои сильные стороны, но они разделяют общие ограничения.
Они текстовые. Все они сериализуются в строки. Машина должна их разобрать для обработки. Разбор – это затраты.
Идеальный язык рассуждений – бинарный поток. Последовательность 16-битных слов. Разбор не нужен. Интерпретируем в момент чтения.
Они были спроектированы до эпохи LLM. Markdown – 2004 год. JSON – 2001 год. XML – 1998 год. Они были спроектированы в эпоху, когда концепции LLM не существовало, для людей или традиционного ПО.
Язык рассуждений ИИ должен быть спроектирован в эпоху LLM, для LLM. Принцип проектирования “1 слово = 1 токен” предполагает существование LLM.
Их единая семантическая система отсутствует или неполна. У Markdown вообще нет семантической системы. У JSON есть структура, но нет смысла. XML может определять схемы, но они не унифицированы.
Семантически выровненный индекс – это глобально единый идентификатор смысла. Где бы он ни использовался, один и тот же SIDX означает одно и то же. Никакой конвертации не нужно. Консенсус встроен.
Резюме
| Формат | Структура | Смысл | Дружелюбие к LLM | Бинарный | Поддержка утверждений | Модификаторы глагола |
|---|---|---|---|---|---|---|
| Markdown | Слабая | Нет | Высокое | Нет | Нет | Нет |
| JSON | Да | Нет | Среднее | Нет | Нет | Нет |
| XML | Да | Частичный | Низкое | Нет | Нет | Нет |
| Идеальный язык рассуждений | Да | Да | Высокое | Да | Да | Да |
Новый формат нужен не потому, что существующие форматы плохи. А потому, что существующие форматы были созданы в другую эпоху, для другой цели.
Markdown создан для документов, которые читают люди. JSON создан для обмена данными в веб-API. XML создан для универсальной сериализации документов и данных.
Формат для записи и накопления рассуждений ИИ. Такого ещё не существует.
Когда цель другая, инструмент должен быть другим.