LINUX.ORG.RU

История изменений

Исправление KivApple, (текущая версия) :

Как я понимаю, это делается с помощью словаря частотности сочетаний букв в языке.

Вероятно, твой чат бот будет получать сообщение целиком, так что тебе подойдёт более простой алгоритм. Можно конвертировать текст в обе раскладки, разбивать на слова, а затем проверять в обоих версиях какой процент слов входит в словарь этого языка (словарь легко получить выкачав дамп какой-нибудь wiktionary и вырезав из него чисто заголовки статей). Если в альтернативной раскладке словарных попаданий больше, чем в исходной, то надо перевести раскладку. В целом тебе играет на руку то, что при неверной раскладке получается совсем бессмыслица, так что на одном из языков будет количество попаданий в словарь около нуля.

Исходная версия KivApple, :

Как я понимаю, это делается с помощью словаря частотности сочетаний букв в языке.

Вероятно, твой чат бот будет получать сообщение целиком. Можно конвертировать его в обе раскладки, разбивать на слова, а затем проверять в обоих версиях какой процент слов входит в словарь этого языка (словарь легко получить выкачав дамп какой-нибудь wiktionary и вырезав из него чисто заголовки статей). Если в альтернативной раскладке словарных попаданий больше, чем в исходной, то надо перевести раскладку. В целом тебе играет на руку то, что при неверной раскладке получается совсем бессмыслица, так что на одном из языков будет количество попаданий в словарь около нуля.