LINUX.ORG.RU

Сообщения question4

 

Странное поведение Tesseract

Не первый раз уже сталкиваюсь, что Tesseract отказывается распознавать, пока не пошевелю гамму.

Скачал видео с субтитрами из Телеграма (MP4), сделал скриншоты в MPV (JPEG), откадрировал ImageMagick-ом (PNG), скормил Tesseract-у. Ничего не нашло. Чуть изменил гамму тем же ImageMagick-ом (convert -gamma), причём в любую сторону и в широком диапазоне (0.125-4) — нормально распознаётся.

В чём может быть дело?

$ tesseract --version
tesseract 5.4.1
 leptonica-1.83.1
  libgif 5.2.1 : libjpeg 6b (libjpeg-turbo 3.0.0) : libpng 1.6.44+apng : libtiff 4.4.0 : zlib 1.3.1 : libwebp 1.4.0 : libopenjp2 2.5.2
 Found AVX
 Found FMA
 Found SSE4.1
 Found OpenMP 201511
 Found libarchive 3.7.7 zlib/1.3.1 liblzma/5.6.2 bz2lib/1.0.8 libzstd/1.5.6
 Found libcurl/8.11.0 OpenSSL/3.3.2 zlib/1.3.1 brotli/1.1.0 zstd/1.5.6 c-ares/1.33.1 libidn2/2.3.7 libpsl/0.21.5 libssh2/1.11.1 nghttp2/1.62.1 nghttp3/1.6.0 librtmp/2.3 OpenLDAP/2.6.4

Модели с tessdata_best 4.1.0.

Пример текста: https://0x0.st/Xn4B.zip

 ,

question4
()

Speech to text

Кто имеет опыт работы с новыми средствами для распознавания речи? Что порекомендуете на десктопную машину без CUDA/OpenCL? Свободное или бесплатное. Английский, русский, французский, украинский, испанский. Скорость распознавания хотя бы 1:1.

P.S. Превращать в текст звуковые файлы.

Ответ: Vosk вполне устраивает.

 

question4
()

В новом KRDC нестабильно работает клавиатура

Gentoo. Обновился до kde-apps/krdc-24.08.1-r1, теперь Alt-Tab и Shift-Ins работают не на всех удалённых машинах. Иногда Alt-Tab перебирает окна исключительно в моей системе. Иногда клавиатура вообще не работает. Иногда клавиатура работает, но не работает Paste из контекстного меню. Удалённые ОС — Windows 10 и Server 2022.

Закрытие вкладки с сеансом и повторный иногда помогают на какое-то время.

Куда копать?

P.S. Теперь вообще стал падать с ошибкой сегментирования:

$ krdc 
KRDC: Starting RDP session
[07:28:50:865] [23707:23707] [WARN][com.freerdp.crypto] - Certificate verification failure 'self-signed certificate (18)' at stack position 0
[07:28:50:865] [23707:23707] [WARN][com.freerdp.crypto] - CN = xxx.xxx.xxx.xxx
[07:28:51:068] [23707:23707] [ERROR][com.winpr.timezone] - Unable to get current timezone rule
[07:28:51:369] [23707:23707] [INFO][com.freerdp.gdi] - Local framebuffer format  PIXEL_FORMAT_RGBX32
[07:28:51:369] [23707:23707] [INFO][com.freerdp.gdi] - Remote framebuffer format PIXEL_FORMAT_BGRA32
[07:28:51:379] [23707:23707] [INFO][com.freerdp.channels.rdpsnd.client] - [static] Loaded pulse backend for rdpsnd
[07:28:51:383] [23707:23707] [INFO][com.freerdp.channels.drdynvc.client] - Loading Dynamic Virtual Channel rdpsnd
[07:28:51:383] [23707:23707] [INFO][com.freerdp.channels.drdynvc.client] - Loading Dynamic Virtual Channel audin
[07:28:51:389] [23707:23707] [INFO][com.freerdp.channels.audin.client] - Loaded pulse backend for audin
[07:28:51:389] [23707:23707] [INFO][com.freerdp.channels.drdynvc.client] - Loading Dynamic Virtual Channel rdpgfx
Ошибка сегментирования

xxx.xxx.xxx.xxx — имя машины, с которой работал перед закрытием.

 , ,

question4
()

Дарл Макбрайд умер

Ещё в сентябре. От склероза. 64 года.

Википедия: https://en.wikipedia.org/wiki/Darl_McBride
Некролог: https://www.memorialutah.com/obituaries/darl-mcbride

Тем, кто давно не следит за этой историей, напомню, что с декабря 2020 он проходил процедуру личного банкротства (Chapter 13):
https://unicourt.com/case/pc-bk5-darl-charles-mcbride-1290201
Бывший CEO SCO -- банкрот
И похоже, с долгами расплатиться не успел.

Попытался найти в сети его мемуары, наткнулся на обложку Форбс 2004 года, где его назвали «врагом корпораций №1»: «Бизнес сходит с ума по свободному ПО. Этот человек утверждает, что владеет его частью. Поэтому он […] повсюду требует денег от больших компаний.»
https://i.ebayimg.com/images/g/pS4AAOSwAQpfd6-o/s-l1600.webp
https://www.befr.ebay.be/itm/326119716776

P.S. Интересно, кто-нибудь видел рекламировавшиеся им книги «Samizdat: And Other Issues Regarding the ‘Source’ Of Open Source Code» и «Snake Bytes: Story of a $34 Billion Software Heist»?

 

question4
()

Замена Outlook

Корпоративный Аутлук отказался ставиться на телефон Huawei — принимает его за рутованный, пишет «обратитесь к админам». Админы посоветовали поставить что-нибудь другое. Что посоветуете поставить вы?

 , , ,

question4
()

Кто чем конвертирует книги?

Вообще, понадобилось сконвертировать пачку PDF во что-нибудь с произвольной шириной страниц. Например, HTML. EPUB или FB2 тоже сгодятся.

В идеале нужно что-нибудь предельно простое в командной строке, типа soffice --convert-to html filename.pdf (который не работает).
Про Calibre знаю, но в его интерфейсе можно блуждать неделями. И он не умеет сохранять HTML.
pdftohtml из poppler работает, но картинки кладёт отдельными файлами. Хотелось бы, чтобы мог сразу в HTML внедрять.

Кто чем пользуется?

 , , ,

question4
()

LibreOffice Writer разучился открывать PDF?

Как заставить PDF открыться во Writer-е? Когда-то достаточно было открыть через File → Open или в консоли lowriter filename.pdf, но теперь он автоматически открывается в Draw.

Ответ: выбрать в диалоге в выпадающем списке типов «PDF - Portable Document Format (Writer) (*.pdf)»

Следующий вопрос: как это сделать при открытии из командной строки? Указывать ту же строку для --infilter= не помогает.

Ответ: --infilter=writer_pdf_import

 ,

question4
()

Драма! Перепродавец ноутбуков Clevo поцапался с CoreBoot

https://old.reddit.com/r/linux/comments/1g6f9rx/dont_support_the_coreboot_project/
https://www.opennet.ru/opennews/art.shtml?num=62079
https://old.reddit.com/r/linuxhardware/comments/15v2y21/stay_away_from_malibal/

Есть такая американская компания — Malibal. Судя по постам на ЛОРе 11-13 лет назад, продаёт ноутбуки Clevo под брендом Malibal. (Судя по ссылкам выше, компания сейчас состоит из 1 человека — сложно представить, как можно долго уживаться с таким скандалистом.) Не так давно Malibal пытался сотрудничать с CoreBoot — прислал недоделанную прошивку, обещал заплатить за доведение её до ума.

В итоге не договорились, никому не заплатили, Malibal ввёл санкции против Польши, Германии, Австрии, Техаса, Лихтенштейна и AMD за сотрудничество с CoreBoot.

Если верить коребутчикам, заказчик не видел разницы между «прошивку можно собрать» и «прошивка рабочая», не знал, где на его плате UART, требовал снизить расценки за работу пропорционально прожиточному минимуму в Польше. И постоянно скатывался на оскорбления.

Последнее подтверждают покупатели этих ноутбуков.

 ,

question4
()

Копировать в буфер иксов из редактора Midnight Commander

Редактор запущен в консоли. Для определённости — Konqueror. Чтобы скопировать текст из консоли в другую программу через буфер, его надо выделить мышью.

Но текст в редакторе MC можно выделять и стрелками с шифтом или через F3 и Shift-F3. Есть даже команда для копирования этого выделения в буфер обмена, но это свой отдельный буфер ~/.cache/mc/mcedit/mcedit.clip. В баг-трекере есть 2 просьбы использовать общеиксовый буфер, одна помечена как выполненная, но требует громоздить пирамиду костылей, другая висит 11 лет без изменений:
https://midnight-commander.org/ticket/30
https://midnight-commander.org/ticket/3081

Как пользоваться иксовым буфером обмена? Существует ли способ проще, чем по ссылкам?

 , ,

question4
()

Что с сервером?

Постоянно сыплются ошибки 404 и 502. Я уж сперва испугался, что Talks снесли.

 

question4
()

Гейман о пиратстве

Наткнулся: https://youtu.be/84M55-TL5go Датировано 26.11.2023.

Автоматическая расшифровка — в комментариях, чтобы не забивать ленту.

Вкратце — говорит, сперва боялся, что если не предпринимать мер к пиратам, автоматически теряет права на выложенные тексты, но потом обнаружил, что его пиратят в России, затем пираты переводят и выкладывают переводы, и когда он пытается издаваться в России, у него неожиданно высокие продажи. Попробовал на месяц выложить бесплатно «Американские боги» на английском — продажи в независимых магазинах подскочили. Приводит пример: примерно 5-10% впервые прочли своего любимого писателя в купленной в магазине книге, а 90-95% — в книге, которую они взяли почитать. Поэтому считает, что бояться пиратства и интернета не следует.

 ,

question4
()

Информационная безопасность и двухфакторная аутентификация

Получил новую машину (для тестирования кросплатформенных программ .Net/Mono), пытаюсь залогиниться в Джиру (на atlassian.net, авторизация через Microsoft), 2-факторная аутентификация, логин, пароль, жду SMS. Жду… Жду… Жду… Меняю способ авторизации на голосовой телефон. Приходит звонок, просит нажать любую кнопку, но все нажатия игнорирует. Иду к админам, беру код, логинюсь.

Вечером возвращаюсь домой, обнаруживаю, что все смс-ки пришли в WhatsApp. Который у меня только десктопный на домашней машине (веб-версия в Electron, если быть точным).

Atlassian Microsoft упрощает работу ЦРУ? :)

Продолжение:
Полез на другой сайт, где та же корпоративная авторизация, и куда давно не заходил. Снова запросило пароль, снова послало код на WhatsApp. Я этот код ввёл. Его отказалось принимать, как неверный. Я запросил новый код. Новый код пришёл по SMS.

 , ,

question4
()

Исправить разрешение в MP4

Есть 2 файла с видео в разрешении 320x240. При попытке запустить их в mpv одновременно командой
mpv --lavfi-complex="[vid1][vid2]vstack[vo];[aid2] acopy [ao]" 1.mp4 --external-file=2.mp4
получаю ошибку
[ffmpeg] Parsed_vstack_0: Input 1 width 480 does not match input 0 width 320.
Аналогично для hstack получаю
[ffmpeg] Parsed_hstack_0: Input 1 height 360 does not match input 0 height 240.
Если поменять файлы местами — ошибка та же. Насколько я понял, в свойствах видеопотоков прописано верное разрешение 320x240, но в свойствах контейнеров 480x360. И для главного файла (input 0) берутся параметры потока, а для external-file (input 1) — параметры контейнера.

(Кому интересно, такие файлы получаются, если сохранять видео с Ютуба через сайт ddownr.com если у видео разрешение ниже заданного в веб-форме. Но для формы минимальное разрешение — 360p.)

Вопрос: как изменить свойства файла, чтобы сделать верное разрешение? Вероятно, это делается одной командой ffmpeg, но я её пока не нашёл. -c copy сохраняет неправильное разрешение.

 

question4
()

Проблемы с подсветкой элементов списка в истории правок?

В списке Оффтопик-лист (изменён 19.07.2024) видно 24 пункта. Если открыть историю правок, в последнем варианте тоже 24 пункта. Но если включить подсветку изменений, пунктов будет 25, добавится «21. Обсуждение криптовалют, не имеющее непосредственного отношения к GNU/Linux.» В чём дело? Удалённый элемент списка не подсвечивается красным и сдвигает нумерацию?

 

question4
()

Чем сейчас лучше писать треки GPS?

Езжу на велосипеде по Москве и области, записываю свой маршрут. Пока попробовал http://agps-tracker.com. Сохраняет в формат GPX (http://www.topografix.com/GPX/1/1/) Когда работает — работает нормально, даже при отсутствии сети, ставит точки каждые несколько секунд, координаты вполне точные. Но иногда уносит точки чёрт знает куда — километров на 40 по горизонтали и на высоту 30 км, например. Или ставит точки через 10-30 минут при заряженной батарее.

Я не вполне представляю, как должен работать трекер в условиях глушения и помех. Такое ощущение, что AGPS-Tracker много выбрасывает как недостоверные. Думаю, пускай пишет всё, без «умного» отсеивания странных точек, их можно будет потом удалить вручную.

Наверное, имеет смысл, чтобы при разряженной батарее трекер сам снижал частоту запросов, чтобы можно было не применять к нему системные средства энергосбережения.

Какие программы посоветуете?

 ,

question4
()

Можете опознать фильм?

https://www.youtube.com/watch?v=DmLJAYRazDY В видеоклипе использованы фрагменты из какого-то фильма. Или, возможно, компьютерной игры.

Мужчина бежит по лесу, выходит к заброшенному дому на опушке, у дома находит убитую лису (или рыжую собаку) с торчащими проводами и раненую чёрно-белую собаку. У него на руке какое-то устройство, которое иногда светится. Находит в доме консервы и какое-то фантастическое электронное оборудование (мелькают надписи «Greenhouse control» и «Artificial intelligence the end of the human race?»), выхаживает собаку. Спит с собакой на сеновале. Потом дверь выбивают, в дом входит человек в броне с ружьями, закреплёнными на руках (вероятно, не один), мелькает какое-то шарообразное устройство (ЭМИ-граната?), дальше беглец лежит мёртвый, из его шеи тоже торчат провода, но камера фокусируется на устройстве на руке, где написано «system transfer complete 100%». Следующий кадр — убежавшая собака, у неё на шее на цепочке устройство, которое раньше носил на шее беглец, наподобие микросхемы в стекле с надписью SONY.

Ответ: Немецкая короткометражка «The Last One» (2014).
https://www.youtube.com/watch?v=gMwcIuPOzgQ
Похоже, снята учащимися Баден-Вюртембергской киноакадемии.

 

question4
()

Ликбез по неразрушающему редактированию при сжатии с потерями

Если формат сжимает с потерями, значит при каждом изменении и сохранении всё будет пережиматься, размываться, будут теряться детали, добавляться артефакты… Но я знаю, что есть исключения. Например, JPEG можно поворачивать на 90 градусов и зеркалить. Вообще JPEG состоит из независимых блоков 8х8 или 16х16, любой из которых можно менять или удалять, не затрагивая остальные. Видео и звук можно обрезать по ключевым фреймам — при склейке первый кадр после шва должен быть ключевым, хвост вообще можно обрезать где угодно. А что ещё?

Можно ли преобразовать JPEG в какой-то из новых форматов без перекодирования? Помимо JPEG XL.

Можно ли конвертировать друг в друга без перекодирования какие-либо из форматов, использующих вейвлетное сжатие: DjVu, JPEG2000, WebP и т.п.?

Можно ли обрезать у видео края кадров без перекодирования? Например, убрать пустое чёрное пространство, добавленное к горизонтальному видео, чтобы сделать его вертикальным.

Перемещено hobbit из talks

 , , , ,

question4
()

Твиттер пишут криворукие дебилы

На этот раз забанили в Твиттере. Успел только зарегистрироваться, отписаться от НАСА, отключить заблюривание небезопасных картинок и пролистать раздел Media одного пользователя года на полтора-два вниз. Выдаёт капчу, но не может её загрузить, так как https://client-api.arkoselabs.com/rtig/image?challenge=0&… выдаёт 403.

 ,

question4
()

5 гласных в алфавитном порядке. Как лучше считать?

Наткнулся на лингвистический прикол: поиск слов, в которых есть все 5 гласных в алфавитном порядке. В случае английского это aeiou («y» не участвует, как дублирующая «i»), и таких слов довольно много. Для русского рассказывавший выбрал аиоуэ, и нашлась только «радиодуэль», которой нет в большинстве словарей.

Я решил тоже попробовать поискать. Питоном в первых попавшихся списках слов. Условия сделал чуть менее жёсткими: гласные должны быть в алфавитном порядке, и из каждой пары а-я, о-ё, у-ю, ы-и, э-е должна быть только одна буква.

Сделал так: из списка слов выбирается subset, в котором ровно по 1 гласной из каждой пары, затем регулярным выражением выбираются слова, где они в алфавитном порядке.

import re, zipfile, py7zr

def five_vowels(w): 
    return w.count('а') + w.count('я') == w.count('э') + w.count('е') == w.count('ы') + w.count('и') == w.count('у') + w.count('ю') == w.count('о') + w.count('ё') == 1

rex = '[^аеёиоуыэюя]*' + '[^аеёиоуыэюя]*'.join(['а*','е*','ё*','и*','о*','у*','ы*','э*','ю*','я*']) + '[^аеёиоуыэюя]*'
# '[^аеёиоуыэюя]*а*[^аеёиоуыэюя]*е*[^аеёиоуыэюя]*ё*[^аеёиоуыэюя]*и*[^аеёиоуыэюя]*о*[^аеёиоуыэюя]*у*[^аеёиоуыэюя]*ы*[^аеёиоуыэюя]*э*[^аеёиоуыэюя]*ю*[^аеёиоуыэюя]*я*[^аеёиоуыэюя]*', w)]

wordlist = zipfile.ZipFile('word_rus.zip').read('word_rus.txt').decode().split('\r\n')
subset = [w for w in wordlist if five_vowels(w)]
ordered = [ w for w in subset if re.fullmatch(rex, w)]
print(ordered)

wordlist = py7zr.SevenZipFile('russian-wordlist-inflections-1251.txt.7z').read(['russian-wordlist-inflections-1251.txt'])['russian-wordlist-inflections-1251.txt'].read().decode('cp1251').split('\n')
subset = [w for w in wordlist if five_vowels(w)]
ordered = [w for w in subset if re.fullmatch(rex, w)]
print(ordered)

Как-то можно это записать покороче?

 ,

question4
()

Кто-нибудь может это пояснить?

Дело было в конце мая, но постов на ЛОРе не было, вроде.

https://github.com/googleapis/elixir-google-api/commit/078b497fceb1011ee26e094029ce67e6b6778220

https://ipullrank.com/google-algo-leak

Вроде бы, случайно выложили документацию по API и ранжированию результатов. Из этого делают далеко идущие выводы.

Кто в этом разбирается, можете подтвердить или опровергнуть?

 ,

question4
()

RSS подписка на новые темы