LINUX.ORG.RU

Awk


53

1

Всего сообщений: 5

Вышел GNU Awk 5.0.0

Группа GNU's Not Unix

Через год после выхода GNU Awk версии 4.2.1 состоялся релиз версии 5.0.0.

( читать дальше... )

>>> Скачать

 , ,

saahriktu
()

Состоялся релиз Miller 5.3.0

Группа Open Source

Miller, подобие awk, sed, cut, join, и sort для индексированных по имени данных, таких как CSV и табличный JSON, теперь версии 5.3.0.

( Читать дальше )

>>> Скачать

 , , , miller,

saahriktu
()

GNU awk 4.0.0

Группа GNU's Not Unix

Аарон Роббинс (Aharon Robbins) сообщил в рассылке о радостном событии — выходе версии 4.0.0 GNU Awk.

При переходе от версии 3.1.8 к 4.0.0 произошел ряд изменений, в том числе и изменения в поведении программы:

  • Изменения в поведении gawk
    • Для `sub' и `gsub' по умолчанию используется поведение согласно стандарту POSIX 2008
    • В соответствии с GNU Coding Standards динамические расширения (плагины) должны теперь определять глобальную переменную plugin_is_GPL_compatible для указания совместимости этих расширений с лицензией GNU GPL
    • В режиме POSIX-совместимости для сравнения строк используется strcoll/wcscoll
    • Диапазоны вида [d-h] теперь обрабатываются так, как в локали C, независимо от типа используемого регулярного выражения, даже при указании --posix. Последняя версия стандарта POSIX разрешает такое поведение. Это изменение должно пресечь замеченное в старых версиях gawk ветки 3.* поведение, когда в некоторых локалях диапазон [a-z] включал в себя символы в верхнем регистре, подробнее этот вопрос рассмотрен в этой теме рассылки, тем не менее рекомендация использовать [[:lower:]] и [[:upper:]] для таких целей всё ещё актуальна
  • Больше не используются специальные файлы /dev/pid, /dev/ppid, /dev/pgrpid, /dev/user. Вместо них рекомендуется пользоваться PROCINFO
  • Пробельные (\s) и отличные от пробельных (\S) управляющие последовательности распознаются в регулярных выражениях
  • Функция split() принимает четвёртый необязательный аргумент: массив, содержащий значения символов-разделителей
  • Новая опция -b / --characters-as-bytes отключает интерпретацию входных данных как многобайтовых символов
  • Новая опция --sandbox
  • Доступны косвенные вызовы функций
  • Количественные модификаторы или квантификаторы (Interval expressions) теперь входят в перечень стандартных регулярных выражений синтаксиса gawk
  • Опция --gen-po получила более корректное наименование --gen-pot
  • switch / case включены по умолчанию, отпала необходимость включать их на этапе конфигурации
  • Добавлена поддержка BEGINFILE и ENDFILE
  • Передача в командную строку gawk вместо имени текстового файла имени каталога, теперь генерирует предупреждение, а не фатальную ошибку [1], если не указана --posix или --traditional, с этими опциями генерируется фатальная ошибка
  • Новая переменная FPAT позволяет указать регулярное выражение для поля, а не для разделителя полей. Новая функция patsplit() даёт такую же возможность для разделения строк
  • Все длинные опции получили короткие аналоги для использования в `#!' скриптах
  • Добавлена поддержка IPv6 через специальный файл /inet6/... ; /inet4/... форсирует использование IPv4, а /inet позволяет считать значение по умолчанию в системе (чаще всего IPv4)
  • Добавлено предупреждение при использовании /[:space:]/ вместо рекомендуемого /[[:space:]]/
  • В основную ветку внесена реализация байт-кодового gawk авторства Джона Хака (John Haque). Добавлен отладчик dgawk, возможно повышение производительности
  • `break' и `continue' недействительны вне цикла, даже при указании --traditional
  • Классы символов POSIX работают с --traditional (BWK awk также поддерживает их)
  • Опции --compat, --copyleft, --usage были удалены по причине их избыточности
  • Добавлены массивы массивов (многомерные массивы)
  • Удалена опция для raw сокетов, поскольку так и не была реализована
  • PROCINFO[«strftime»] теперь содержит формат по умолчанию для strftime()
  • При разработке новой версии использованы Autoconf 2.68, Automake 1.11.1, Gettext 0.18.1, Bison 2.5
  • Выполнена чистка кода, в том числе удалён код для старых, неподдерживаемых систем (Atari, Amiga, BeOS, Cray, MIPS RiscOS, MS-DOS с Microsoft Compiler, MS-Windows с Microsoft Compiler, NeXT, SunOS 3.x, Sun 386 (Road Runner), Tandem (non-POSIX), Prestandard VAX C compiler for VAX/VMS и др.)
  • Если PROCINFO[«sorted_in»] определён, циклы, выполняющие обработку элементов массива по так называемой конструкции «for(iggy in foo)» сортируют индексы прежде чем приступить к проходу по циклу. Значение этого элемента позволяет осуществлять контроль за тем, как индексы будут отсортированы перед началом обхода цикла
  • Новая фукнция isarray() проверяющая, является ли элемент массивом, делает возможной обработку многомерных массивов
  • Функции asort() и asorti() принимают третий аргумент для указания способа сортировки

Исходные коды

>>> Подробности

 , ,

anarquista
()

первая публичная бета-версия gawk 4.0

Группа GNU's Not Unix

Arnold Robbins, разработчик gnu awk, сообщает о выходе первой бета-версии грядущего релиза 4.0:

этот релиз завершает более чем полуторагодичную напряжённую работу многих людей и включает значительное количество как крупных нововведений, так и мелких улучшений.

насколько я могу судить, документация и код находятся в стадии заморозки.

так почему же бета-версия? потому, что только вы, да-да, вы, конечный пользователь, сможете заметить, поломал ли я что-нибудь в вашем gawk, и сообщить мне об этом, чтобы я внёс исправления к финальному релизу.

спасибо,

Arnold Robbins

Изменения между 3.1.8 и 4.0.0:

  1. Вместо специальных файлов /dev/pid, /dev/ppid, /dev/pgrpid и /dev/user теперь используется PROCINFO.
  2. 'sub' и 'gsub' теперь по умолчанию ведут себя в соответствии с posix 2009.
  3. В рег. выражениях теперь распознаются \s и \S.
  4. split() принимает четвёртый необязательный аргумент — массив с разделителями.
  5. Новая опция -b/--characters-as-bytes, означающая «руки прочь от моих данных». gawk не будет пытаться распознать во вводе многобайтовую строку.
  6. Новая опция --sandbox. см. документацию.
  7. Теперь есть косвенный вызов функций.
  8. Интервальные выражения теперь — часть дефолтных рег. выражений.
  9. --gen-po переименована в корректную --gen-pot.
  10. Теперь по умолчанию доступны switch/case (раньше требовалось указывать конф. опцию).
  11. gawk ныне поддерживает BEGINFILE и ENDFILE. см. документацию.

...

И ещё двадцать пунктов, ознакомиться с которыми можно в первоисточнике новости.

gnu awk распространяется на условиях лицензии gnu gpl v3+

список рассылки: bug-gawk@gnu.org

архив с бета-версией

домашняя страница

первоисточник новости

>>> первоисточник перевода

 , ,

sash-kan
()

Эффективное управление системными журналами

Группа Документация

В этой статье вы узнаете о простом, но полезном способе комбинировать возможности обработки данных awk и XML, который можно использовать для представления системных данных о UNIX® в удобной для восприятия форме, пригодной для отправки в корпоративную сеть или интернет. UNIX создает отчеты о производительности и загруженности системы, расходе ресурсов и отчеты с другой системной информацией, которая может использоваться управляющими персоналом и другими заинтересованными лицами.

>>> Подробности

 , , ,

IBM_dW
()