История изменений
Исправление red75prim, (текущая версия) :
а кластеры разумеется определяются свойствами. верней - «свойства» это то, что порождает кластеры.
Для LLM нет никаких «свойств». Есть последовательность токенов. «Свойства» нужно сначала получить. Если кластеризацию выполнять по синтаксису, то получим что «это неправильно» ближе к «это правильно», чем к «это ошибочно» (и такие проблемы в своё время были).
Исходная версия red75prim, :
а кластеры разумеется определяются свойствами. верней - «свойства» это то, что порождает кластеры.
Для LLM нет никаких «свойств». Есть последовательность токенов. «Свойства» нужно сначала получить. Если кластеризацию выполнять по синтаксису, то получим что «это не правильно» ближе к «это правильно», чем к «это ошибочно» (и такие проблемы в своё время были).