LINUX.ORG.RU

История изменений

Исправление debugger, (текущая версия) :

Когда текст на английском языке - всё работает супер

А ты уверен? xlsx — это по сути zip-архив с xml-ками, т. е. бинарный файл, причём пожатый бинарный файл. Давно ли grep умеет распаковывать архивы, чтобы искать в них текст?? Ты пробовал искать что-нибудь более осмысленное, чем ‘text’?

xls – тоже бинарный формат, грепать его — не слишком удачная идея. Но если этот формат не использует сжатие (я не в курсе), то найти в нём текст грепом может быть и получится. А может, и нет.

Чтобы что-то грепать в xls и xlsx файлах, надо для начала сконвертировать их в текст.

P. S. Глянул щас на образчик xls файла. Похоже, что он без сжатия. Но в зависимости от ячейки текст может быть сохранён или в ASCII (или, может, в ISO 8859-1) (если только латинские буквы), или в UTF-16 (если есть русские буквы). Поэтому из консоли грепать русский текст в xls занятие нетривиальное. Конверторы кодировок типа iconv сконвертировать xls скорее всего не смогут, т. к. это не текст а бинарный файл, поэтому надо перекодировать саму строку поиска, что муторно (и не поможет в случае xlsx). Проще найти конвертилку xls и xlsx в текстовый вид, а потом уж и грепать.

P. P. S. Советов тебе надавали, конечно, огонь… рукалицо.jpg

Исправление debugger, :

Когда текст на английском языке - всё работает супер

А ты уверен? xlsx — это по сути zip-архив с xml-ками, т. е. бинарный файл, причём пожатый бинарный файл. Давно ли grep умеет распаковывать архивы, чтобы искать в них текст?? Ты пробовал искать что-нибудь более осмысленное, чем ‘text’?

xls – тоже бинарный формат, грепать его — не слишком удачная идея. Но если этот формат не использует сжатие (я не в курсе), то найти в нём текст грепом может быть и получится. А может, и нет.

Чтобы что-то грепать в xls и xlsx файлах, надо для начала сконвертировать их в текст.

P. S. Глянул щас на образчик xls файла. Похоже, что он без сжатия. Но в зависимости от ячейки текст может быть сохранён или в ASCII (или, может, в ISO 8859-1) (если только латинские буквы), или в UTF-16 (если есть русские буквы). Поэтому из консоли грепать русский текст в xls занятие нетривиальное. Конверторы кодировок типа iconv сконвертировать xls скорее всего не смогут, т. к. это не текст а бинарный файл, поэтому надо перекодировать саму строку поиска, что муторно (и не поможет в случае xlsx). Проще найти конвертилку xls и xlsx в текстовый вид, а потом уж и грепать.

Исправление debugger, :

Когда текст на английском языке - всё работает супер

А ты уверен? xlsx — это по сути zip-архив с xml-ками, т. е. бинарный файл, причём пожатый бинарный файл. Давно ли grep умеет распаковывать архивы, чтобы искать в них текст?? Ты пробовал искать что-нибудь более осмысленное, чем ‘text’?

xls – тоже бинарный формат, грепать его — не слишком удачная идея. Но если этот формат не использует сжатие (я не в курсе), то найти в нём текст грепом может быть и получится. А может, и нет.

Чтобы что-то грепать в xls и xlsx файлах, надо для начала сконвертировать их в текст.

P. S. Глянул щас на образчик xls файла. Похоже, что он без сжатия. Но в зависимости от ячейки текст может быть сохранён или в ASCII (если только латинские буквы), или в UTF-16 (если есть русские буквы). Поэтому из консоли грепать русский текст в xls занятие нетривиальное. Конверторы кодировок типа iconv сконвертировать xls скорее всего не смогут, т. к. это не текст а бинарный файл, поэтому надо перекодировать саму строку поиска, что муторно. Проще найти конвертилку xls и xlsx в текстовый вид, а потом уж и грепать.

Исходная версия debugger, :

Когда текст на английском языке - всё работает супер

А ты уверен? xlsx — это по сути zip-архив с xml-ками, т. е. бинарный файл, причём пожатый бинарный файл. Давно ли grep умеет распаковывать архивы, чтобы искать в них текст?? Ты пробовал искать что-нибудь более осмысленное, чем ‘text’?

xls – тоже бинарный формат, грепать его — не слишком удачная идея. Но если этот формат не использует сжатие (я не в курсе), то найти в нём текст грепом может быть и получится. А может, и нет.

Чтобы что-то грепать в xls и xlsx файлах, надо для начала сконвертировать их в текст.