La IA necesita un nuevo lenguaje

GEUL — Un lenguaje artificial semánticamente alineado para la comunicación inequívoca entre humanos e IA

¿Por qué se necesita un lenguaje artificial?

El lenguaje natural evolucionó para la comunicación humana. La ambigüedad, la redundancia y la implicación son ventajas para los humanos, pero causas de alucinación para la IA. Ni los lenguajes de programación ni los marcos semánticos existentes son la respuesta. Se necesita un nuevo lenguaje artificial que satisfaga seis condiciones simultáneamente.

Por que el lenguaje natural crea alucinaciones?

La alucinacion no es un bug del LLM — es consecuencia estructural inevitable de cuatro defectos del lenguaje natural: ambiguedad, ausencia de fuente, de confianza y de tiempo. Modelos mas grandes no lo solucionan.

Por qué los vectores de embedding no son suficientes

Reordenar los vectores de embedding rompe el modelo. Evitar la rotura implica reconstruir el modelo desde cero. Lo que se necesita no es transparencia dentro de la caja negra, sino una capa transparente fuera de ella.

Por que fracaso el esperanto

Los lenguajes artificiales para humanos fracasaron — los lenguajes artificiales para IA son diferentes

Por qué Wikidata

GEUL no rechaza Wikidata. Transforma el sistema de clasificación y las estadísticas de frecuencia de 100 millones de entidades en libros de códigos SIDX. Construye gramática sobre un diccionario.

¿Por qué WordNet?

Construir un sistema de verbos desde cero significa lagunas, decisiones arbitrarias y falta de fundamento. WordNet es una base de datos léxica de 40 años con 13.767 synsets de verbos creados por lingüistas. Tomamos prestado el diccionario y construimos la gramática encima.

Por qué los comentarios deben ser índices

Los comentarios se escriben para humanos. Pero cuando hay 10.000 funciones, las máquinas también deben leerlos. Si convertimos los comentarios de narrativa a índice, el escaneo completo se convierte en búsqueda instantánea.

Por qué debemos dejarlo vacío

GEUL deja vacío el 75% de su espacio de 64 bits. Las lecciones de IPv4, Unicode y ASCII nos enseñan: el costo de llenar es irreversible, pero el costo de dejar vacío es cero.