Вот такой запрос:
www.linux.org.ru/search.jsp?q=python&range=TOPICS&interval=THREE_YEAR...
Почему-то для некоторых тем выдаёт фрагмент текста (сниппет) не с начала топика, а выдирает три-четыре слова из середины большого текста.
Алгоритм, вроде, понял. Ищется самое короткое предложение (от точки до точки), содержащее искомое слово. Но получается как-то не очень...
Предложение: Не надо самое короткое предложение (особенно, если в нём всего пяток слов). Лучше максимально длинный (ещё допустимый для сниппета на лоре) кусок текста (с искомым словом), находящийся максимально близко к началу стартового сообщения.