WordNet

動詞エッジ

13,767個のWordNet動詞を10個のPrimitive → 68個のSub-primitiveに分類し、ハフマン符号化で16ビットコードブックを生成する。Tiny(2ワード)/Short(3ワード)/Full(5ワード)の3種パケットで平均2.16ワード圧縮を達成する。

なぜWordNetなのか

動詞体系をゼロから作れば、漏れが生じ、恣意的になり、根拠がない。WordNetは言語学者が40年かけて蓄積した13,767個の動詞synsetデータベースだ。辞書を借り、文法は自ら作る。