LINUX.ORG.RU
решено ФорумTalks

Нечёткий поиск в куче текстовых файлов

 ,


1

1

Подскажите самый простой вариант сабжа, желательно утилиту. Без индексирования.

Дано: несколько сотен файлов с результатом распознавания речи вида [временная метка] слова - запись трёхчасовых разговоров.

Надо найти в них фразу, допуская все беды сразу и вместе - неверно распознанные слова, отсутствующие слова, продолжение в следующей строке, ну и проигнорировать метки вначале строк.

Чем?

★★★★

Последнее исправление: token_polyak (всего исправлений: 2)

Чем?

Python с FuzzyWuzzy ©.

желательно утилиту

agrep ©.

quickquest ★★★★★
()

Это тестовое задание? Могу сделать за тебя за долю в твоей будущей зарплате.

snizovtsev ★★★★★
()

Решил, заслуженные доли медали из картофела торжественно нарезал и раздал отписавшимся.

token_polyak ★★★★
() автор топика
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)