Десктопные поисковики не нужны.

0

0

У них у всех наблюдается пренеприятная антифича: они подолгу молотят твой жесткий диск, кушая ценные ресурсы системы, так, что нормально работать на ней не представляется возможным, с целью «обновить индексы».

Но при этом, мля, у меня столько информации, что «обновление» (которое впору бы назвать полной перезаливкой) занимает по полдня.

Вот и нафиг упало такое счастье? Добавим ко всему, что некоторые примочки работают только с Beagle, другие только со Strigi, третьи только со Swish++.

Короче говоря, без единого API на полнотекстовый поиск, который обеспечит возможность прикрутить любой поддерживающий его движок для всей системы, десктопные поисковики суть непомерный расход времени без большой пользы именно на тех системах, где они нужнее всего (читай, где многогигабайтный срач в /home, как у меня).

Dixi.

Ссылка

←	KDE4 на стероидах

Новая фича на ЛОРе?

→

← 1 2 3 4 →

Ответ на: комментарий от geek 31.10.07 14:08:25 MSK

да, locate видимо, тоже не юнихвей :(

geek ★★★
(31.10.07 14:12:32 MSK)

Ответ на: комментарий от geek 31.10.07 14:12:32 MSK

>да, locate видимо, тоже не юнихвей :(

А каким боком он контентный поисковик?

~~KRoN73~~ ★★★★★
(31.10.07 14:17:05 MSK)

Ответ на: комментарий от anonymfus 31.10.07 13:57:48 MSK

> Пока никаких письменно оформленных предложений нет, кроме высказанных здесь:)
> Начал писать пародию на RFC... Раз уж здесь так к этому относятся...
> anonymfus * (*) (31.10.2007 13:57:48)

Пиши мне на pacify@mail.ru - будем рожать вместе :)
ИМХО, идеи распределенных вычислений с децентрализованным управлением очень перспективны - и по этому пути пойдет развитие харда и софта в ближайшее будущее.

pacify ★★★★★
(31.10.07 14:17:11 MSK)

Ссылка

Ответ на: комментарий от geek 31.10.07 14:08:25 MSK

> ну и заодно попинать базы данных, lastlog, flow-tools и прочие инструменты, который - о ужас! хранят данные в бинарном виде, и требуют специальных утилит для извлечения

http://en.wikipedia.org/wiki/Unix_way

ps я не считаю базы данных не труЪ

defmacro
(31.10.07 14:18:20 MSK)

Ответ на: комментарий от pacify 31.10.07 14:12:30 MSK

>Аналогично, перед тем, как определять нужность индексаторов

так нужность не определяют. Вопят "индексатор не нужен!". Собсно, на этом спор можно и закончить

я привел юскейсы, которые показывают, что эти вопли - пустое место. Всё

не надо на меня вешать чужих собак.

>P.S. За грубости в этом треде извиняюсь.

ок, взаимно

>пытался выяснить - собираетесь ли Вы помогать сообществу в создании более совершенных программ ...

думал разделить тракер на монитор и собстно индексатор. Задача, когда нужно висеть на inotify встречается куда чаще, чем индексация. А кол-во хуков inotify ограничено, и на все программки может не хватить

собсно, вопрос только в наличии продолжительных кусков свободного времени

а далее - можно и Query-интерфейс стандартизировать, и сервис написать, куда могут подключаться программы/агенты, умеющие что-то искать и т.д. Идей масса, времени куда меньше

geek ★★★
(31.10.07 14:20:26 MSK)

Ответ на: комментарий от sabonez 31.10.07 14:03:59 MSK

> Очень обидно видеть, что на UNIX-way все стали класть.

Очень обидно, что для некоторых UNIX-way из удобного средства превратился в фетиш и еще обиднее, что они не понимают, что UNIX-way тоже развивается.

Shaman007 ★★★★★
(31.10.07 14:20:55 MSK)

Ссылка

Ответ на: комментарий от KRoN73 31.10.07 14:17:05 MSK

Он поисковик по метаданным. Имя файла - тот же тэг на самом деле.

Shaman007 ★★★★★
(31.10.07 14:21:50 MSK)

Ссылка

Ответ на: комментарий от KRoN73 31.10.07 14:17:05 MSK

>А каким боком он контентный поисковик?

он не контентый. Просто индексатор имен файлов

geek ★★★
(31.10.07 14:23:36 MSK)

Ссылка

Ответ на: комментарий от defmacro 31.10.07 14:18:20 MSK

>http://en.wikipedia.org/wiki/Unix_way

то что там написано - мне прекрасно известно. И индексаторы ничем не противоречат унхвею

geek ★★★
(31.10.07 14:24:42 MSK)

Ответ на: комментарий от geek 31.10.07 14:24:42 MSK

> то что там написано - мне прекрасно известно. И индексаторы ничем не противоречат унхвею

Ты про бинарные форматы что-то там говорил.

defmacro
(31.10.07 14:33:12 MSK)

Что за дебильный подход ко всему "мне не нужно, значит никому не нужно"?

Ну я, скажем, не имею нужды в десктопном поиске, потому что у меня относительно мало локальных документов, как правило нужный мне документ находится online, на sciencedirect итд, и используется мною 1-2 раза. Так что мне по уши хватает стратегии "just fucking Google it." Но если есть много локальных документов, к которым нужен многократный доступ, то нужен и сравнимый по эффективности локальный поиск, и тут tracker, beagle итд незаменимы.

grob ★★★★★
(31.10.07 14:33:31 MSK)

Ссылка

Ответ на: комментарий от defmacro 31.10.07 14:33:12 MSK

>Ты про бинарные форматы что-то там говорил.

из того, что grep не умеет бинарные форматы - делать вывод, что бинарные форматы - не унихвей - некорректно.

geek ★★★
(31.10.07 14:35:21 MSK)

Ответ на: комментарий от geek 31.10.07 14:20:26 MSK

> Вопят "индексатор не нужен!".
> я привел юскейсы, которые показывают, что эти вопли - пустое место. Всё

То, что индексы предназначены для ускорения поиска - это понятно.
Другое дело, что тупые средства построения индексов можно усовершенствовать -
построить событийно-ориентированную поисковую систему по unix-way, как предлагает anonymfous.

> Идей масса, времени куда меньше

Выкладывай идеи на свой сайт - сделаем LOR Web Ring ;)
"В единстве - наша сила" (с) Центризбирком

pacify ★★★★★
(31.10.07 14:35:26 MSK)

Ответ на: комментарий от pacify 31.10.07 14:35:26 MSK

>Другое дело, что тупые средства построения индексов можно усовершенствовать - построить событийно-ориентированную поисковую систему по unix-way, как предлагает anonymfous.

усовершенствовать можно всё что угодно. А вот сделать сразу идеальный инструмент - практически нереально.

>Выкладывай идеи на свой сайт - сделаем LOR Web Ring ;)

надо подумать, да. Собсно, одну идею я уже высказал =)

geek ★★★
(31.10.07 14:39:05 MSK)

Ссылка

Ответ на: комментарий от geek 31.10.07 14:35:21 MSK

> из того, что grep не умеет бинарные форматы - делать вывод, что бинарные форматы - не унихвей - некорректно.

При чем здесь grep?

defmacro
(31.10.07 14:42:03 MSK)

Ответ на: комментарий от defmacro 31.10.07 14:42:03 MSK

>При чем здесь grep?

не знаю. Просто некоторые считают, что унихвей - это обязательно plain text.

geek ★★★
(31.10.07 14:43:46 MSK)

Ответ на: комментарий от geek 31.10.07 14:43:46 MSK

> не знаю. Просто некоторые считают, что унихвей - это обязательно plain text.

Write programs to handle text streams, because that is a universal interface." (c) Doug McIlroy

defmacro
(31.10.07 14:52:38 MSK)

Ответ на: комментарий от defmacro 31.10.07 14:52:38 MSK

>Write programs to handle text streams, because that is a universal interface." (c) Doug McIlroy

cat не умеет обрабатывать текстовые потоки. cat - не юнихвей?

flow-cat, flow-nfilter, flow-stat - тоже. Они тоже не юнихвей?

может стоит понять, что есть программы, чья задача не заключается в обработке текста?

geek ★★★
(31.10.07 14:55:37 MSK)

Ответ на: комментарий от geek 31.10.07 14:55:37 MSK

> может стоит понять, что есть программы, чья задача не заключается в обработке текста?

Ну тогда стоит уточнить также, что есть `обработка текста' :)

defmacro
(31.10.07 15:03:47 MSK)

Ответ на: комментарий от defmacro 31.10.07 15:03:47 MSK

>Ну тогда стоит уточнить также, что есть `обработка текста' :)

фильтрация/редактирование.

собсно, можно ещё и требовать вывод результата в текстовой форме - ну так тот же трекер это делает.

geek ★★★
(31.10.07 15:07:01 MSK)

Ответ на: комментарий от geek 31.10.07 15:07:01 MSK

> собсно, можно ещё и требовать вывод результата в текстовой форме - ну так тот же трекер это делает.

Ну тогда труЪ :)

defmacro
(31.10.07 15:10:14 MSK)

Ссылка

Ответ на: комментарий от geek 31.10.07 14:55:37 MSK

>cat не умеет обрабатывать текстовые потоки
а что тогда это?!:
>{saahЯiktu} cat /etc/csh.logout - > file0
>text stream
>{saahЯiktu} cat file0
>#
># System-wide .logout file for csh(1).
>
>text stream

Суть в том, чтобы всё что только можно было прозрачно и человекочитаемо.
Это также упрощает автоматизацию, из-за чего UNIX'ы на этом-то и не одну собаку съели.
Понятное дело, что бинарные форматы уменьшают размеры медиа файлов - графика, музыка, видео,.. етц
Однако, и обработка этих файлов уже не является такой простой, хотя, это особо и не актуально - был бы вьювер/плэйер.
А вот работа с тэгами и прочей мета-инфой уже представляет собой ту еще задачу.

Вообщем, каждый решает всё сам для себя - что ему нужно и как с этим работать.
Нужны бинарные форматы - пожалуйста. Но и на сложность автоматизации их обработки нечего пенять.
Темболее ругаться на скорость работы, по сути, костылей.

saahriktu ★★★★★
(31.10.07 15:56:20 MSK)

Ответ на: комментарий от saahriktu 31.10.07 15:56:20 MSK

>а что тогда это?!:

ну какая же это обработка =) Это чтение и вывод

вот zcat ещё куда ни шло...хотя это и скрипт, дергающий gzip =)

geek ★★★
(31.10.07 16:00:34 MSK)

Ответ на: комментарий от geek 31.10.07 16:00:34 MSK

Дык речь идёт об текстовых потоках в качестве универсальных интерфейсов.
Одна программа ложит текст на выход, который является входом для другой программы, которая его и читает со своего входа.
Благодаря чему и возможны конвейеры '|'.
Конвейеров в своём примере я не привёл, но всё работает и с ними.
Например:
head -n 1 /etc/csh.logout | cat -
#

Здесь head ложит на вход cat'а _текст_, который, как и в моём первом примере, вполне мог быть набран с клавиатуры.

saahriktu ★★★★★
(31.10.07 16:08:26 MSK)

Ответ на: комментарий от saahriktu 31.10.07 16:08:26 MSK

>Дык речь идёт об текстовых потоках в качестве универсальных интерфейсов.

как быть с locate и find ? Не унихвей уже, да ?

geek ★★★
(31.10.07 16:15:53 MSK)

> где многогигабайтный срач в /home, как у меня

Спецы Far рекомендуют в таких случаях... ;-)

eugine_kosenko ★★★
(31.10.07 16:22:46 MSK)

Ссылка

Ответ на: комментарий от pacify 31.10.07 14:35:26 MSK

>Выкладывай идеи на свой сайт

Первые мысли тут:

http://specialforlor.narod.ru/russia.html

anonymfus ★★★★
(31.10.07 16:23:21 MSK)

Ответ на: комментарий от geek 31.10.07 16:15:53 MSK

>как быть с locate и find ? Не унихвей уже, да ?
они тоже читают со входа и ложат на выход
example:
>find px/ -iname "*`ndate y`*" | head -n 4
>px/ascii/20070829.txt
>px/ascii/20070901.txt
>px/ascii/20070930.txt
>px/ascii/20071002.txt
здесь `ndate y` ложит на выход чило года, которое оболочка вписывает в командную строку, которая тоже, по сути, является входным текстовым потоком. результат find'а передаётся дальше head'у (конвейер).

saahriktu ★★★★★
(31.10.07 16:30:48 MSK)

Ответ на: комментарий от geek 31.10.07 16:15:53 MSK

>как быть с locate и find ? Не унихвей уже, да ?

Ето есть в любой UNIX-системе, а трекеры - далеко не везде.

Что уважаемый будет делать, если ему доведется че нить отыскать на файлопомойке на каком нить SCO (не к ночи будет помянуто) ?

~~sabonez~~ ★☆☆☆
(31.10.07 16:31:56 MSK)

Ответ на: комментарий от sabonez 31.10.07 16:31:56 MSK

>Что уважаемый будет делать, если ему доведется че нить отыскать на файлопомойке на каком нить SCO (не к ночи будет помянуто) ?

ну...каменному веку - каменные топоры, что делать. Если уж трекер не соберется

geek ★★★
(31.10.07 16:48:32 MSK)

Ответ на: комментарий от saahriktu 31.10.07 16:30:48 MSK

>они тоже читают со входа и ложат на выход

>find

помедленнее, я записываю. Что в данном примере find берет из stdin?

а класть в stdout и tracker-search умеет

geek ★★★
(31.10.07 16:49:51 MSK)

Ответ на: комментарий от geek 31.10.07 16:48:32 MSK

>Если уж трекер не соберется

Епт!!! :-0

~~sabonez~~ ★☆☆☆
(31.10.07 16:55:28 MSK)

Ответ на: комментарий от sabonez 31.10.07 16:55:28 MSK

>Епт!!! :-0

шо епт? Компилять разучился уже, да? Быстро в первый класс на генту!

geek ★★★
(31.10.07 16:57:52 MSK)

Ответ на: комментарий от geek 31.10.07 16:57:52 MSK

На что ж люди не идут дабы стандартными утилитами не пользоваться.

А компилять под СКО - дело надо сказать геморное, ето не гента...

~~sabonez~~ ★☆☆☆
(31.10.07 17:11:14 MSK)

Ответ на: комментарий от sabonez 31.10.07 17:11:14 MSK

>На что ж люди не идут дабы стандартными утилитами не пользоваться.

люди могут и стандартными утилитами пользоваться, только зачем, если есть инструменты лучше? Ну а там где нет - то да, старые утилиты

geek ★★★
(31.10.07 17:18:17 MSK)

Ссылка

Ответ на: комментарий от geek 31.10.07 16:49:51 MSK

>помедленнее, я записываю. Что в данном примере find берет из stdin?
не из stdin, а из переменных своего окружения, что сути связывания программ текстовыми интерфейсами в цепочку не меняет.
вот если бы оно всегда пускалось с дефолтными аргументами и не могло быть связано в цепочку с другим софтом - тогда это бы было винвэем
а так - это юниксвэй
>а класть в stdout и tracker-search умеет
ну и прекрасно

saahriktu ★★★★★
(31.10.07 17:29:29 MSK)

Ответ на: комментарий от saahriktu 31.10.07 17:29:29 MSK

>не из stdin, а из переменных своего окружения, что сути связывания программ текстовыми интерфейсами в цепочку не меняет.

я тогда вообще не понял, чем find юнихвейнее трекера. Трекер делает ровно тоже самое. Апчом спорим?

geek ★★★
(31.10.07 17:41:25 MSK)

Ответ на: комментарий от geek 31.10.07 17:41:25 MSK

> Апчом спорим?

ИМХО о том, что все большее массовое засилье бинарной каши (pdf, djvu) для текстовых документов суть зло и никак не тот самый вей...

Bod ★★★★
(31.10.07 18:19:32 MSK)

снос бигля - одно из первых дел после установки системы

Osmos ★★
(31.10.07 18:56:42 MSK)

Ссылка

Ответ на: комментарий от Bod 31.10.07 18:19:32 MSK

>ИМХО о том, что все большее массовое засилье бинарной каши (pdf, djvu) для текстовых документов суть зло и никак не тот самый вей...

я весь внимание. Какая альтернатива есть?

geek ★★★
(31.10.07 19:40:28 MSK)

Ответ на: комментарий от anonymfus 31.10.07 12:18:09 MSK

согласен.

zort ☆
(31.10.07 20:11:02 MSK)

Ссылка

Ответ на: комментарий от geek 31.10.07 19:40:28 MSK

А какая у зла может быть альтернатива? ;) Это не конструктив, это крик души... Я вообще слабо понимаю суть и важность упомянутых форматов. С декларируемым "...ваш документ будет одинаково выглядеть на любом компьютере.." легко справляется всякий графический формат. А Adobe еще и постоянно меняет PDF...

Bod ★★★★
(31.10.07 20:24:35 MSK)

Ответ на: комментарий от Bod 31.10.07 20:24:35 MSK

> справляется всякий графический формат.

Текст таскать в виде рендеренных превьюшек? Или вместе? И в каком разрешении? Сжатие с потерями или без? А что на счет цветового пространства? А устройства вывода у нас будет гвоздями вколочено "односторонний А4"? PDF действительно выглядет везде одинаково: и на экране и на принтере.

Надоели студенты не печатавшие чего-то сложнее отчета по лабе в ворде.

Shaman007 ★★★★★
(31.10.07 20:55:11 MSK)

Ответ на: комментарий от Bod 31.10.07 20:24:35 MSK

>А какая у зла может быть альтернатива? ;)

а почему зло?

>легко справляется всякий графический формат

это даже не "бугога"

geek ★★★
(31.10.07 21:14:15 MSK)

Ссылка

> Десктопные поисковики не нужны.

+1. Достаточно просто не срать (хотя, произнося подобное на ЛОРе, мне кажется, что я требую невозможного).

shahid ★★★★★
(31.10.07 21:17:01 MSK)

Ответ на: комментарий от shahid 31.10.07 21:17:01 MSK

> Достаточно просто не срать

Это очень вредно для здоровья.

http://www.myanek.ru/?catid=25&page=53 шестой нумер

sin_a ★★★★★
(31.10.07 21:36:19 MSK)

Ссылка

Ответ на: комментарий от shahid 31.10.07 21:17:01 MSK

> Апчом спорим?
Спор в данном треде заходил о многих вещах.
Начиная от трушности бинарных форматов до юниксвэйности текстовых программных интерфейсов и юниксвэйности cat'а, find'а и иже с ними.

Бинарные форматы некошерны из-за человеконечитаемости и сложной автоматизации их обработки (см. выше).
Если рассматривать альтернативу PDF'у именно как рецепту переносимости документов, то это - DVI.
dvi2tty быстр как медвежья болезнь. только в классическом виде у него с кириллицей вообще никак. прикручивать, однако, надо.
а так, кошерными форматами документов являются TeX, XML, html, plain text.
сам я храню всё в plain text'е

saahriktu ★★★★★
(31.10.07 21:37:32 MSK)

Ответ на: комментарий от shahid 31.10.07 21:17:01 MSK

Ага, скажи еще что бы мы и не ссали.

anonymous
(31.10.07 21:37:57 MSK)

Ссылка

Ответ на: комментарий от saahriktu 31.10.07 21:37:32 MSK

>Бинарные форматы некошерны из-за человеконечитаемости и сложной автоматизации их обработки (см. выше).

ну, как раз бинарные данные обрабатываются легче, хотя и non-human-readable. Что удобно компу - неудобно человеку, и наоборот. Так что это всё лирика, хотя, кончено, такая позиция вполне понятна.

>Если рассматривать альтернативу PDF'у именно как рецепту переносимости документов, то это - DVI.

придется убить всех человеков, и наделать новых

geek ★★★
(31.10.07 21:47:07 MSK)

Ответ на: комментарий от shahid 31.10.07 21:17:01 MSK

>Достаточно просто не срать

в этом треде уже неоднократно было показано, почему такая позиция является идиотской

geek ★★★
(31.10.07 21:50:12 MSK)

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 3 4 →

←	KDE4 на стероидах

Talks

Новая фича на ЛОРе?

→

Похожие темы