История изменений
Исправление debugger, (текущая версия) :
Когда текст на английском языке - всё работает супер
А ты уверен? xlsx — это по сути zip-архив с xml-ками, т. е. бинарный файл, причём пожатый бинарный файл. Давно ли grep умеет распаковывать архивы, чтобы искать в них текст?? Ты пробовал искать что-нибудь более осмысленное, чем ‘text’?
xls – тоже бинарный формат, грепать его — не слишком удачная идея. Но если этот формат не использует сжатие (я не в курсе), то найти в нём текст грепом может быть и получится. А может, и нет.
Чтобы что-то грепать в xls и xlsx файлах, надо для начала сконвертировать их в текст.
P. S. Глянул щас на образчик xls файла. Похоже, что он без сжатия. Но в зависимости от ячейки текст может быть сохранён или в ASCII (или, может, в ISO 8859-1) (если только латинские буквы), или в UTF-16 (если есть русские буквы). Поэтому из консоли грепать русский текст в xls занятие нетривиальное. Конверторы кодировок типа iconv сконвертировать xls скорее всего не смогут, т. к. это не текст а бинарный файл, поэтому надо перекодировать саму строку поиска, что муторно (и не поможет в случае xlsx). Проще найти конвертилку xls и xlsx в текстовый вид, а потом уж и грепать.
P. P. S. Советов тебе надавали, конечно, огонь… рукалицо.jpg
Исправление debugger, :
Когда текст на английском языке - всё работает супер
А ты уверен? xlsx — это по сути zip-архив с xml-ками, т. е. бинарный файл, причём пожатый бинарный файл. Давно ли grep умеет распаковывать архивы, чтобы искать в них текст?? Ты пробовал искать что-нибудь более осмысленное, чем ‘text’?
xls – тоже бинарный формат, грепать его — не слишком удачная идея. Но если этот формат не использует сжатие (я не в курсе), то найти в нём текст грепом может быть и получится. А может, и нет.
Чтобы что-то грепать в xls и xlsx файлах, надо для начала сконвертировать их в текст.
P. S. Глянул щас на образчик xls файла. Похоже, что он без сжатия. Но в зависимости от ячейки текст может быть сохранён или в ASCII (или, может, в ISO 8859-1) (если только латинские буквы), или в UTF-16 (если есть русские буквы). Поэтому из консоли грепать русский текст в xls занятие нетривиальное. Конверторы кодировок типа iconv сконвертировать xls скорее всего не смогут, т. к. это не текст а бинарный файл, поэтому надо перекодировать саму строку поиска, что муторно (и не поможет в случае xlsx). Проще найти конвертилку xls и xlsx в текстовый вид, а потом уж и грепать.
Исправление debugger, :
Когда текст на английском языке - всё работает супер
А ты уверен? xlsx — это по сути zip-архив с xml-ками, т. е. бинарный файл, причём пожатый бинарный файл. Давно ли grep умеет распаковывать архивы, чтобы искать в них текст?? Ты пробовал искать что-нибудь более осмысленное, чем ‘text’?
xls – тоже бинарный формат, грепать его — не слишком удачная идея. Но если этот формат не использует сжатие (я не в курсе), то найти в нём текст грепом может быть и получится. А может, и нет.
Чтобы что-то грепать в xls и xlsx файлах, надо для начала сконвертировать их в текст.
P. S. Глянул щас на образчик xls файла. Похоже, что он без сжатия. Но в зависимости от ячейки текст может быть сохранён или в ASCII (если только латинские буквы), или в UTF-16 (если есть русские буквы). Поэтому из консоли грепать русский текст в xls занятие нетривиальное. Конверторы кодировок типа iconv сконвертировать xls скорее всего не смогут, т. к. это не текст а бинарный файл, поэтому надо перекодировать саму строку поиска, что муторно. Проще найти конвертилку xls и xlsx в текстовый вид, а потом уж и грепать.
Исходная версия debugger, :
Когда текст на английском языке - всё работает супер
А ты уверен? xlsx — это по сути zip-архив с xml-ками, т. е. бинарный файл, причём пожатый бинарный файл. Давно ли grep умеет распаковывать архивы, чтобы искать в них текст?? Ты пробовал искать что-нибудь более осмысленное, чем ‘text’?
xls – тоже бинарный формат, грепать его — не слишком удачная идея. Но если этот формат не использует сжатие (я не в курсе), то найти в нём текст грепом может быть и получится. А может, и нет.
Чтобы что-то грепать в xls и xlsx файлах, надо для начала сконвертировать их в текст.