Поиск по регулярному выражению в массиве небольших строк

0

3

Такая вот задача. Можно придумать что-нибудь лучше, чем просто перебирать все строки? Длинна строка — 10 символов, строк — мильёны.

Ссылка

←	Perl. Регулярки.

Передать содержимое переменной

→

← 1 2 →

Ответ на: комментарий от anonymous 13.05.15 16:55:42 MSK

Если писать недумавши, то и асм станет медленным.

Cactus64k ★
(13.05.15 18:50:30 MSK)

Ссылка

patricia trie

~~qulinxao~~ ★★☆
(13.05.15 21:54:24 MSK)

От перебора в общем случае не уйти. Но сам по себе поиск по регулярке можно и нужно соптимизировать, - парсить регулярку один раз, а затем использовать её прекомпилированную миллион раз.

Sorcerer ★★★★★
(13.05.15 22:47:20 MSK)

Подстрока, которую ты ищешь произвольной длины?

peregrine ★★★★★
(13.05.15 22:53:45 MSK)

Можно придумать что-нибудь лучше, чем просто перебирать все строки?

если по немеренному фиксированному массиву многократно идёт поиск разными регулярками, то в теории: во первых заранее сократить диапазон символов (по 8-ми битным кодам поиск существенно быстрее чем по 16-ти и сильно-сильно быстрее чем по utf8), далее тестить разные либы на производительность :-) в комплекте perl`pcre, posix`regexp + в сети есть либы от yandex и google (нестандартные).

Для ограниченного набора фич можно теребить студентов в Job - построение различных FA по регулярке входит в обязательную программу CS.

MKuznetsov ★★★★★
(13.05.15 22:54:00 MSK)

Ответ на: комментарий от MKuznetsov 13.05.15 22:54:00 MSK

кстати можно и параллелить на треды-ядра и хосты-ноды

MKuznetsov ★★★★★
(13.05.15 23:05:01 MSK)

Ссылка

Ответ на: комментарий от qulinxao 13.05.15 21:54:24 MSK

Спасибо.

dann ★
(13.05.15 23:56:14 MSK) автор топика

Ссылка

Ответ на: комментарий от Sorcerer 13.05.15 22:47:20 MSK

Ага.

dann ★
(13.05.15 23:56:57 MSK) автор топика

Ссылка

Ответ на: комментарий от peregrine 13.05.15 22:53:45 MSK

Да.

dann ★
(13.05.15 23:57:28 MSK) автор топика

Ссылка

Ответ на: комментарий от MKuznetsov 13.05.15 22:54:00 MSK

На правах студента разберусь сам =-) Скажи, что такое FA?

dann ★
(13.05.15 23:58:45 MSK) автор топика

Ответ на: комментарий от dann 13.05.15 23:58:45 MSK

FA - finite automat, он же КА - конечный автомат. Для posix re строится обычно классический автомат с таблицей переходов и состояний, для perl - стековый автомат.

MKuznetsov ★★★★★
(14.05.15 00:41:44 MSK)