Есть примерно 1Тб уникальных текстовых строк длиной около <5к символов. Это все нужно сохранить и сделать по этому полнотекстовый поиск, который даст хотя бы 100 результатов в минуту. Крайне желательна поддержка морфологии для популярных языков.
И тут у меня есть 2 вопроса: в чем хранить данные и чем их индексировать. Данные будут сравнительно редко изменяться (хочется избавиться от изменений вообще). Запись в общую базу будет происходить скорее всего чанками по 100 метров из кэша MySQL && Redis. Т.е. хранилище будет на 99.9% перманентным и использоваться будет только для поиска.
Пока посматриваю в сторону sphinx/solr, потому что приходилось их использовать пару раз. А вот как, где и в чем хранить столько данных не имею понятия.