ugrep 7.1 и 7.1.1

1

4

22 и 30 ноября состоялись выпуски 7.1 и 7.1.1 быстрой кроссплатформенной консольной утилиты поиска текста ugrep, написанной на языке C++ и распространяемой по лицензии BSD-3.

Для более эффективного поиска в больших файловых системах на медленных носителях, или при поиске во многих архивах (zip, tar и др.), можно предварительно выполнить индексирование утилитой ugrep-indexer (входит в поставку ugrep, начиная с версии 6.0).

Список изменений:

добавление подсветки синтаксиса шаблонов поиска и другие улучшения TUI;
добавлена поддержка опции --filter (Windows);
обеспечена работа дополнительных скриптов ug+ и ugrep+ при недоступности вспомогательных конвертеров файлов (pdftotext, Poppler, antiword, pandoc или exiftool);
исправлено инвертирование классов символов при использовании опции -i (или --ignore-case) для соответствия с поведением GNU grep при использовании опций -i и -P;
устранены некоторые предупреждения -Woverload-virtual и -Wshadow при сборке библиотеки RE/flex, TUI и индексатора ugrep-indexer.

>>> Подробности

Ссылка

←	HandBrake 1.9.0

Опубликован графический стандарт Vulkan 1.4

→

Для более эффективного поиска в больших файловых системах на медленных носителях,

больших файловых системах

Честно говоря, не особо понимаю, как размер ФС на это вообще влияет, да и в оригинале этого не вижу.

Сам не тестил случаем, как оно?

CrX ★★★★★
(02.12.24 13:53:49 MSK)

Ответ на: комментарий от CrX 02.12.24 13:53:49 MSK

да и в оригинале этого не вижу.

Please note that indexing is effective for large file systems on slower storage media or when searching many zip and tarball archives. Indexing won’t speed up regular file searching on fast nVME SSDs, for example.

Сам не тестил случаем, как оно?

Тестировал на HDD/Btrfs+zstd, хорошо. :)

dataman ★★★★★
(02.12.24 13:57:14 MSK) автор топика
Последнее исправление: dataman 02.12.24 13:59:22 MSK (всего исправлений: 1)

Ответ на: комментарий от dataman 02.12.24 13:57:14 MSK

Indexing won’t speed up regular file searching on fast nVME SSDs, for example.

А почему?

micronekodesu ★★★
(02.12.24 14:06:53 MSK)

Ответ на: комментарий от micronekodesu 02.12.24 14:06:53 MSK

Понятия не имею, у меня нет SSD.

dataman ★★★★★
(02.12.24 14:13:04 MSK) автор топика

Ответ на: комментарий от CrX 02.12.24 13:53:49 MSK

как размер ФС на это вообще влияет

Фраза «большой размер ФС» как-бы подразумевает «100ТБ старый и поганый составной массив на убогих дисках, полностью засраный невменяемым количеством мелких файлов». Без индекса тут вообще никак.

Интересно, сколько бы собирался индекс на таком диске: гогол лет, или гоголплекс, хммм?)

~~somemong~~
(02.12.24 15:02:20 MSK)

Ссылка

Я так понимаю, над емаксом больше не смеёмся?

buddhist ★★★★★
(02.12.24 15:50:40 MSK)

написанной на языке C++

Фатальный недостаток.

BceM_IIpuBeT ★★☆☆☆
(02.12.24 15:57:13 MSK)

Хорошая вещь

blex ★★★★★
(02.12.24 15:57:42 MSK)

Ссылка

Хорошая тулзень, когда нужно быстренько что-то глянуть в логе, который на пару десятков гигов. Под Фряшкой можно его сбилдить с портов добавив поддержку AVX и SSE2.

iron ★★★★★
(02.12.24 17:47:28 MSK)

7.1 и 7.1.1

Странное версионирование.

Gonzo ★★★★★
(02.12.24 18:20:50 MSK)

Ответ на: комментарий от Gonzo 02.12.24 18:20:50 MSK

Нет. Странное, когда из четырёх чисел. :)

dataman ★★★★★
(02.12.24 18:29:37 MSK) автор топика

Ответ на: комментарий от dataman 02.12.24 18:29:37 MSK

Уже понял. Просто выпустили новее версию с фиксами. Почему-то подумал сначала, что это две ветки. Ты так не делай больше, в чем смысл? :)

Gonzo ★★★★★
(02.12.24 19:01:10 MSK)

Ответ на: комментарий от Gonzo 02.12.24 19:01:10 MSK

в чем смысл?

Список солидней. :)

dataman ★★★★★
(02.12.24 19:54:42 MSK) автор топика

Ссылка

Ответ на: комментарий от CrX 02.12.24 13:53:49 MSK

Для более эффективного поиска в больших файловых системах на медленных носителях,

больших файловых системах

Честно говоря, не особо понимаю, как размер ФС на это вообще влияет

На HDD, чем ближе данные находятся к концу диска, тем медленнее они пишутся/читаются.

И не надо сейчас про NVMe и прочее. Речь не только о личном ноутбуке.

mord0d ★★★★★
(02.12.24 20:11:00 MSK)
Последнее исправление: mord0d 02.12.24 20:11:18 MSK (всего исправлений: 1)

Ответ на: комментарий от dataman 02.12.24 18:29:37 MSK

Странное, когда из четырёх чисел

Да, не особо понятно:

$ [version]::new('7.5.0.1')

Major  Minor  Build  Revision
-----  -----  -----  --------
7      5      0      1

dmitry237 ★★★★★
(02.12.24 20:17:30 MSK)

Ссылка

Ответ на: комментарий от mord0d 02.12.24 20:11:00 MSK

На HDD, чем ближе данные находятся к концу диска, тем медленнее они пишутся/читаются.

А размер ФС причём? Ближе к концу диска может быть хоть часть данных на большой ФС на весь диск, хоть все файлы на малюсенькой ФС, но расположенной в конце диска.

CrX ★★★★★
(02.12.24 20:26:13 MSK)

Ответ на: комментарий от dataman 02.12.24 18:29:37 MSK

когда из четырёх чисел

Арч: 0.8.0-2
Дебиан: 6.11.10-1

Почему? Вполне понятно. Как уже написали выше: мажор, минор, билд, ревизия.

Gonzo ★★★★★
(02.12.24 21:20:11 MSK)
Последнее исправление: Gonzo 02.12.24 21:20:30 MSK (всего исправлений: 1)

Ответ на: комментарий от Gonzo 02.12.24 21:20:11 MSK

А бывает еще так:

alsa-plugins 1:1.2.12-4

Вот это я уже не совсем догоняю…

Gonzo ★★★★★
(02.12.24 21:21:32 MSK)
Последнее исправление: Gonzo 02.12.24 21:21:47 MSK (всего исправлений: 1)

Googling files

занятно…

seiken ★★★★★
(02.12.24 22:15:58 MSK)

Ссылка

Ответ на: комментарий от BceM_IIpuBeT 02.12.24 15:57:13 MSK

Для консольной утилиты пофиг.

seiken ★★★★★
(02.12.24 22:19:06 MSK)

Ответ на: комментарий от dataman 02.12.24 14:13:04 MSK

Понятия не имею, у меня нет SSD.

Это такой скуф’ский прикол? Давай я тебе подкину SSD’ху.
Может ты там на CD-ROM’е диски ещё жгёшь…?

~~Shprot~~ ★★
(02.12.24 23:10:48 MSK)

Ответ на: комментарий от seiken 02.12.24 22:19:06 MSK

Зачем ты оскорбляешь растоманов?

BceM_IIpuBeT ★★☆☆☆
(03.12.24 00:38:10 MSK)

Ссылка

Проверил поиск простой подстроки в проекте. Файлы (~3,500) были подсунуты в аргументы команды. Медленнее всего сработала входящая в состав macOS реализация grep. Затем примерно одинаково сработали GNU grep и p9p grep. Преимущество p9p версии в том, что она не ждёт завершения всего поиска, чтобы вывести результаты, а выводит их постепенно. Ну и ugrep и ripgrep оказались значительно быстрее.

Обидно за p9p: в нём был впервые реализован Thompson NFA. Видимо, ugrep и ripgrep каким-то образом лучше справляются с IO.

kaldeon ★
(03.12.24 04:52:48 MSK)
Последнее исправление: kaldeon 03.12.24 04:54:00 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от BceM_IIpuBeT 02.12.24 15:57:13 MSK

От выстрела в ногу ещё никто не умирал.

kaldeon ★
(03.12.24 04:56:26 MSK)

Ссылка

Ответ на: комментарий от buddhist 02.12.24 15:50:40 MSK

А причём тут emacs?

kaldeon ★
(03.12.24 05:11:40 MSK)

Ответ на: комментарий от kaldeon 03.12.24 05:11:40 MSK

Видимо, собеседник хочет сказать, что в сабже есть всё, кроме…

hobbit ★★★★★
(03.12.24 11:58:56 MSK)

Ссылка

Ответ на: комментарий от CrX 02.12.24 20:26:13 MSK

А размер ФС причём?

Черепичная запись, которая применяется на дисках большого объёма.

Невозможно создать файловую систему больше, чем объём диска. Если только это не RAID-0, но там свои нюансы.

mord0d ★★★★★
(03.12.24 12:00:14 MSK)

Ответ на: комментарий от mord0d 03.12.24 12:00:14 MSK

Причём тут это всё…

CrX ★★★★★
(03.12.24 12:53:50 MSK)

Ссылка

Ответ на: комментарий от kaldeon 03.12.24 05:11:40 MSK

При том, что пере-грепалка/недо-фм – это первый шаг к ОС из текстового редактора

buddhist ★★★★★
(03.12.24 12:59:57 MSK)

Ссылка

Ответ на: комментарий от Gonzo 02.12.24 18:20:50 MSK

4 != 4.0

BceM_IIpuBeT ★★☆☆☆
(03.12.24 16:52:58 MSK)

Ссылка

Ответ на: комментарий от CrX 02.12.24 13:53:49 MSK

Скорее имелось ввиду - индексирует дерево каталогов для ускорения поиска в медленных файловых системах и файловых системах, которые «холодные», т.е. недавно не кэшировались в памяти.

spawn_sp ★★★★
(03.12.24 22:28:27 MSK)

Ответ на: комментарий от spawn_sp 03.12.24 22:28:27 MSK

для ускорения поиска в медленных файловых системах и файловых системах, которые «холодные», т.е. недавно не кэшировались в памяти

Да, это я и прочитал на гитхабе. И это вполне логично. А вот откуда именно большие ФС в новости — пытаюсь выяснить.

CrX ★★★★★
(03.12.24 22:30:15 MSK)
Последнее исправление: CrX 03.12.24 22:30:30 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Gonzo 02.12.24 21:21:32 MSK

Это где такое?. Типа слот, как в gentoo? gcc-14.2.1_p20241116:14

spawn_sp ★★★★
(03.12.24 22:55:39 MSK)

Ответ на: комментарий от Gonzo 02.12.24 21:20:11 MSK

мажор, минор, билд, ревизия

Если следовать https://semver.org/lang/ru, то ревизия не обязательна.

dataman ★★★★★
(04.12.24 09:13:20 MSK) автор топика

Ответ на: комментарий от Shprot 02.12.24 23:10:48 MSK

скуф’ский

Вообще мимо. Советую не использовать слов из новояза, не зная ни их значений, ни «обласканных» ими людей.

Давай я тебе подкину SSD’ху.

В другую страну? Сильно вряд ли.
Но можно деньгами. С нетерпением жду! :-D

dataman ★★★★★
(04.12.24 09:16:16 MSK) автор топика

Ссылка

Ответ на: комментарий от dataman 04.12.24 09:13:20 MSK

А для чего BuildLabel, для распознавания разлия в сборке одного и того же?

$ [semver]::new(1,2,3,'preview','test-1')           

Major  Minor  Patch  PreReleaseLabel BuildLabel
-----  -----  -----  --------------- ----------
1      2      3      preview         test-1

$ [semver]::new(1,2,3,'preview','test-1').ToString()
1.2.3-preview+test-1

Вообще конструктор в pwsh (.Net) такой:

$ [System.semver]::new                                     

OverloadDefinitions
-------------------
semver new(string version)
semver new(int major, int minor, int patch, string preReleaseLabel, string buildLabel)
semver new(int major, int minor, int patch, string label)
semver new(int major, int minor, int patch)
semver new(int major, int minor)
semver new(int major)
semver new(version version)

dmitry237 ★★★★★
(04.12.24 09:30:39 MSK)

Ответ на: комментарий от dmitry237 04.12.24 09:30:39 MSK

А для чего BuildLabel, для распознавания разлия в сборке одного и того же?

Дата сборки или SHA, например.

Сборочные метаданные МОГУТ быть обозначены добавлением знака плюс и ряда разделённых точкой идентификаторов, следующих сразу за патчем или предрелизной версией. Идентификаторы ДОЛЖНЫ содержать только ASCII буквенно-цифровые символы и дефис [0-9A-Za-z-]. Идентификаторы НЕ ДОЛЖНЫ быть пустыми. Сборочные метаданные СЛЕДУЕТ игнорировать, когда определяется старшинство версий. Поэтому два пакета с одинаковой версией, но разными сборочными метаданными, рассматриваются как одна и та же версия.

Примеры: 1.0.0-alpha+001, 1.0.0+20130313144700, 1.0.0-beta+exp.sha.5114f85.

dataman ★★★★★
(04.12.24 09:54:58 MSK) автор топика

Ответ на: комментарий от dataman 04.12.24 09:54:58 MSK

Спасибо, понял.

dmitry237 ★★★★★
(04.12.24 10:01:25 MSK)

Ссылка

Ответ на: комментарий от spawn_sp 03.12.24 22:55:39 MSK

Это где такое?

Арч:

https://archlinux.org/packages/extra/x86_64/alsa-plugins/

Объяснение:

https://wiki.archlinux.org/title/PKGBUILD#epoch

Debian:

https://packages.debian.org/bookworm/vim

Объясниение:

https://www.debian.org/doc/debian-policy/ch-controlfields.html#version

Gonzo ★★★★★
(04.12.24 16:33:11 MSK)
Последнее исправление: Gonzo 04.12.24 16:38:08 MSK (всего исправлений: 1)

The Silver Searcher вызывается сокращением ag, ripgrep — rg. Здесь ug? Было бы в тему.

Upd. Посмотрел мануал — да, ug.

rebforce ★
(04.12.24 16:42:44 MSK)
Последнее исправление: rebforce 04.12.24 16:44:45 MSK (всего исправлений: 1)

Ответ на: комментарий от rebforce 04.12.24 16:42:44 MSK

Здесь ug

Угадал. Держи пирожок.

Gonzo ★★★★★
(04.12.24 16:44:53 MSK)

Ссылка

Ответ на: комментарий от Gonzo 04.12.24 16:33:11 MSK

Спасибо.

spawn_sp ★★★★
(04.12.24 22:16:13 MSK)

Ссылка

Ответ на: комментарий от dataman 04.12.24 09:13:20 MSK

Если следовать https://semver.org/lang/ru, то ревизия не обязательна.

Это не какая-то абстрактная «ревизия» от разрабов программы. Это патч-номер дистрибутива. То есть версия патча, которую в этом дистрибутиве накладывают на эту версию пакета. Версия 1.2.3-4 означает, что на оригинальный пакет версии "1.2.3" в самом дистрибутиве наложили патч, и версия этого патча - "4".

К примеру:

$ apt show build-essential
Package: build-essential
Version: 12.9
...

Это пакет от самих разрабов дистрибутива, у него патч-номера нет.

$ apt show dmidecode
Package: dmidecode
Version: 3.4-1
Priority: important
...

$ apt show xterm
Package: xterm
Version: 379-1
...

Это типичные пакеты из опакаченного апстрима с использованием версии апстрима, к ним накатили один типовой патч и больше не меняли этот патч в течении жизни этого релиза. В таком виде находится большинство пакетов. Но есть исключения:

$ apt show gcc
Package: gcc
Version: 4:12.2.0-3
...

В этом релизе к gcc уже дважды модифицировали дистрибутивный патч. Кроме того, у gcc - есть номер «эпохи», отличный от нуля - значит схему версионирования пакетов уже меняли четыре раза.

LamerOk ★★★★★
(04.12.24 23:17:16 MSK)

Ссылка

Выглядит прекрасно. Но возникают вопросы отвлечённого плана: если я введу строку за три секунды и найду не за ноль три, а за ноль ноль три, как это уже влияет на рабочий процесс?

massimus ★★★
(20.12.24 13:39:55 MSK)

Ссылка

Ответ на: комментарий от iron 02.12.24 17:47:28 MSK

Хорошая тулзень, когда нужно быстренько что-то глянуть в логе, который на пару десятков гигов.

Тут уже пора задуматься об Elasticsearch.

ugoday ★★★★★
(20.12.24 13:52:01 MSK)

Ответ на: комментарий от ugoday 20.12.24 13:52:01 MSK

Тут уже пора задуматься об Elasticsearch.

Он нужен только если нужно часто заглядывать в логи. А если раз в пару месяцев – нет смысла тратить ресурсы на него.

iron ★★★★★
(20.12.24 16:21:43 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	HandBrake 1.9.0

Open Source

Опубликован графический стандарт Vulkan 1.4

→

Похожие темы