LINUX.ORG.RU
ФорумTalks

Чтение информации из текстовых файлов

 


1

1

Други мои, а есть ли в природе программулина/либа для считывания текстовой информации, скажем, из doc-файлов и упаковывания её в какую-нибудь БД?

Есть таблица упорядоченных данных, хотелось бы без привлечения дополнительных оч.умелых ручек аккуратно и быстро преобразовать в таблицу/цы БД.

Deleted

Ответ на: комментарий от Shaman007

В принципе, можно было написать самому, но это и без того затянет процесс реализации проджекта. Хотя фичка вроде как востребована в масштабах конторы.

Deleted
()
Ответ на: комментарий от Deleted

Создай тему в девелопменте, подпусти слезы: «я делаю doc2txt, а получается какая-то ерунда, помогите».

Но, конечно, самый смак будет сделать через опенофис на пайтоне. Не, даже не на пайтоне, а посадить пару теток копировать из райтера в кальк и оттуда сохранять в csv.

abraziv_whiskey ★★★★★
()
Последнее исправление: abraziv_whiskey (всего исправлений: 1)

Ну есть Apache POI для чтения .doc. Но лучше .xls, так как там хоть структура похожая на таблицу

maxcom ★★★★★
()
Ответ на: комментарий от maxcom

Спасибо.

К жабке имею навык так себе, дополнительный стимул для вкуривания.

Deleted
()
Последнее исправление: rht (всего исправлений: 1)

Есть, и ты представляешь собой ее последнюю модель.

Tark ★★
()

Интересно, а с каких пор doc — это текстовый файл?

На winfaq — наверняка есть интерпрайзное решение.

Evgueni ★★★★★
()
Ответ на: комментарий от vsemnazlo

Спасибо, это к слову про Пострес.

Deleted
()
Ответ на: комментарий от Deleted

если выберешь Apatar - можешь стучаться с вопросами

vostrik ★★★☆
()
Ответ на: комментарий от maxcom

оно все уж больно монстрообразно и энтерпрайзно

Вот-вот. Не, в принципе можно и написать. Тем более, что спрос есть. Со временем туго на джастфорфан.

Deleted
()

программулина/либа для считывания текстовой информации, скажем, из doc-файлов

antiword

static_lab ★★★★★
()

У любой нормальной «какой-нибудь БД» есть средства загрузки данных из файлов. Могу сказать что в sqlite это точно есть. Сепаратор в текстовом файле присутствует?

rimsleur
()
Ответ на: комментарий от Deleted

В смысле?

Ну для загрузки файла в базу нужно чтобы колонки разделялись символом-сепаратором. Чаще всего это ';' иногда может использоваться TAB, это не важно, главное — сепаратор должен быть. Если есть таблица в екселе, то ее можно сохранить как текстовый файл с разделителем. И уже этот файл грузи куда хош.

rimsleur
()
Ответ на: комментарий от rimsleur

Не хорошо

Девелоперов таблиц много.

Deleted
()
Ответ на: комментарий от maxcom

Если xls, то можно ssconvert-ом в CSV, далее везде.

frob ★★★★★
()
Ответ на: комментарий от Evgueni

Интересно, а с каких пор doc — это текстовый файл?

всегда был. только пожат LZ77/78. ну и со своим NIH-форматированием.

drBatty ★★
()
Ответ на: комментарий от drBatty

Ну не вся правда же. Если бы это было так, то проблем с его разбором не было бы. Вы почему-то выпустили из виду всякие бинарные вкрапления.

Evgueni ★★★★★
()
Ответ на: комментарий от Evgueni

Ну не вся правда же. Если бы это было так, то проблем с его разбором не было бы. Вы почему-то выпустили из виду всякие бинарные вкрапления.

ну да, COM та ещё песня.

drBatty ★★
()
Ответ на: комментарий от Evgueni

всякие бинарные вкрапления

А разве из топика не очевидно, что речь не о бинарных вкраплениях?

Deleted
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.