LINUX.ORG.RU

Большой релиз LanguageTool 4.0

 , , , ,


3

2

LanguageTool — это свободная система для проверки грамматики, стиля, пунктуации и орфографии. LanguageTool может использоваться как независимое приложение или как расширение LibreOffice/OpenOffice. Созданы расширения для браузеров Mozilla Firefox, Google Chrome. Для мобильных устройств разработан сервис проверки грамматики и орфографии LanguageTool proofreader для Android.

В новой версии:

  • Обновлены модули проверки для английского, португальского, польского, немецкого, украинского, каталанского, французского, галисийского, нидерландского и русского языков.
  • Теперь программа работает и на Java 9, но рекомендуется для использования Java 8.
  • Создан модуль для сборки пакетов RPM с независимой версией.
  • Для английского, немецкого и португальского языков реализована новая языковая модель поиска пар похожих слов с использованием нейросети — word2vec. Использование этого метода для поиска пар похожих слов требует дополнительного файла word2vec.tar.gz для работы нейросети.
  • Добавлены новые правила поиска межъязыковых омонимов.

Изменения в русскоязычном модуле:

  • Созданы новые и улучшены существующие правила для проверки пунктуации и грамматики.
  • Добавлены новые слова для проверки орфографии в независимой версии.

>>> Подробности



Проверено: Shaman007 ()
Последнее исправление: Shaman007 (всего исправлений: 1)
Ответ на: комментарий от utanho

А что мешает совмещать пойло с комментариями?

gwinn ★★★★
()
Ответ на: комментарий от Yakov

а можешь подсказать какую-нибудь книжку по структурной лингвистике русского языка? Конкретные правила, схемы, итп. Знакомые советуют Зализняка, например, есть еще что-нибудь?

какие-нибудь курсы по матлингвистике?

stevejobs ★★★★☆
()
Последнее исправление: stevejobs (всего исправлений: 1)
Ответ на: комментарий от stevejobs

Для начала можно ознакомиться с проектом AOT.ru О технологиях можно почитать на сайте проекта: http://www.aot.ru/technology.html

В рамках проекта разработан семантический анализатор http://www.aot.ru/docs/seman.html и http://www.aot.ru/cgi-bin/seman.py. В качестве одного из элементов проверки грамматики можно использовать семантический анализатор. Если он не смог разобрать предложение — значит в предложении содержится ошибка. Но, например, для фразы «Я иду искать» анализатор aot.ru (seman) построил только 1 связь (иду->я). Слово «искать» оказалось оторванным, и , следовательно, должно быть помеченным как ошибочное. А возможных вариантов связей может быть множество! То есть для практического применения этого метода требуется ещё дополнительная работа по описанию связей. И всё равно, этот метод не годится для поиска некоторых типов грамматических ошибок. Но я рассматриваю возможность включения такой или подобной технологии в состав LT. Одного семантического анализатора для проверки грамматики недостаточно!

Поэтому проще использовать уже созданные реализации программ для проверки грамматики, например LanguageTool, чем делать новую программу, так как подводных камней при анализе текста очень много :)

Yakov
() автор топика
Последнее исправление: Yakov (всего исправлений: 2)
Ответ на: комментарий от barberry

Это уже исправлено в ежедневных сборках: https://forum.languagetool.org/t/languagetool-org-file-created-in-home-direct...

Скачать ежедневные сборки можно здесь: https://languagetool.org/download/snapshots/?C=M;O=D

Yakov
() автор топика
Последнее исправление: Yakov (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.