LINUX.ORG.RU
ФорумTalks

У OpenBSD теперь свой vi

 , ,


0

1

Привет, ЛОР!

Тащемта сабж: https://www.opennet.ru/opennews/art.shtml?num=56735

Отдельно порадовало, что там нет поддержки юникода от слова совсем.

No support for Unicode / UTF-8 / wide character display

    Multi-byte characters are shown as individual bytes, rather than glyphs

@saahriktu будет доволен!

★★★★★

Последнее исправление: sudopacman (всего исправлений: 1)

Ответ на: комментарий от vertexua

И так раз 5 пробовал.

you tell me! я тоже наслушался этих разговоров, что она типа такая-то и такая-то, но каждый раз было, как у тебя.

А тут маргинальщина работает так круто. Очень приятное впечатление

да, верю. действительно было бы здорово покрутить.

crypt ★★★★★
()
Ответ на: комментарий от Reset

Ρ� Ρ�ΠΎΠ³Π»Π°Ρ�ΠµΠ½ Ρ�ΠΎΠ²ΠµΡ€Ρ�ΠµΠ½Π½ΠΎ, Π½ΠΈΠΊΠ°ΠΊΠΈΠµ Ρ�ΠΈΠΌΠ²ΠΎΠ»Ρ‹ ΠΊΡ€ΠΎΠΌΠµ Π»Π°Ρ‚ΠΈΠ½ΠΈΡ†Ρ‹ Π½Πµ Π½ΡƒΠ¶Π½Ρ‹

zgen ★★★★★
()
Ответ на: комментарий от crypt

блин, что я пишу... я слишком мало сплю и слишком много сижу на лоре.

не без того

zgen ★★★★★
()
Ответ на: комментарий от crypt

да, верю. действительно было бы здорово покрутить.

Такой привкус Alpine Linux. Но чуть более цельная система.

Я сейчас OpenBSD гоняю с Wireguard сервером. Траффик телефона гоняю через него. Не ради шапки из фольги, было просто интересно потыкать протокол, поизучать что он может. Завелось за 5 минут между отойти приготовить кофе

vertexua ★★★★★
()
Ответ на: комментарий от zgen

you tell me! я тоже наслушался этих разговоров, что она типа такая-то и такая-то, но каждый раз было, как у тебя.

FreeBSD - это какая-то гента курильщика где все сломано и через жопу.

vertexua ★★★★★
()
Ответ на: комментарий от vertexua

Такой привкус Alpine Linux. Но чуть более цельная система.

я после перехода на FreeBSD (ну ты видел мой пост), аж прослезился, что кто-то это делает. это, конечно, все не для продакшена... но как же это греет душу... эта интегрированность и цельность! а OBSD, я уверен, еще лучше.

crypt ★★★★★
()
Последнее исправление: crypt (всего исправлений: 1)
Ответ на: комментарий от vertexua

Помогает вроде с криптографией

Всмысле OS помогает? Или канадцы в разработке участвуют? О Канаде я мало знаю.

crypt ★★★★★
()
Ответ на: комментарий от crypt

Не, Канада в смысле «не США». США налагает ограничения на экспорт сильной криптографии. Это в основном налагает проблемы на разный софт (в основном правда проприетарный, например проприетарная Java) и он потом выходит без криптографии. В Канаде или ЕС таких проблем нету.

Например OpenSSH и OpenSSL - подпроекты OpenBSD, который в Канаде. Были бы они в США - мы бы почуствовали.

vertexua ★★★★★
()
Ответ на: комментарий от crypt

Я не очень понял вопрос.

Я только знаю что юрисдикция США мешает писать крипто. OpenSSL успешен потому что он не проект, который базируется в США. Его как бы импортируют, а потом экспортируют из США.

Я жаже не знаю как дела с libnss или с криптографией Go. Они вроде из США, но надежны. Почему им не нужно делать то, что нужно делать Oracle JDK?

Не юрист, больше не знаю

vertexua ★★★★★
()
Последнее исправление: vertexua (всего исправлений: 4)
Ответ на: комментарий от vertexua

ну ладно, я просто думал, есть какое-то выражение у вас европейцев про канаду, которое я не знаю:) подтупливаю чуток, все ок)

crypt ★★★★★
()
Ответ на: комментарий от vertexua

лады. завтра гляну. у нас уже вовсю ночь.)

crypt ★★★★★
()
Ответ на: комментарий от vertexua

Тем не менее, на момент 2010 в вендах, лялехах и макосах поддержка UTF-8 была минимум лет 10 как. Точно так же OpenBSD с тредами и поддержкой SMP тянул хз сколько. Big Kernel Lock они вроде только лет 5 назад выпилили, если мне память не изменяет.

Короче, такой вот очень консервативный проект, на самом-то деле.

hateyoufeel ★★★★★
() автор топика
Ответ на: комментарий от vertexua

Ты точно мне отвечал?

Я то как раз с фрей дружу (в отличие от генты)

zgen ★★★★★
()
Ответ на: комментарий от vertexua

FreeBSD - это какая-то гента курильщика где все сломано и через жопу.

хаха!) ну по крайне мере я это сделал (Переход с Linux на FreeBSD. Успех, но...), фан есть, а что еще нужно дома? я был на генту, когда-то...

есть классная фишка с обновлениями: сделал снапшот корня на ZFS и накатываешь новый релиз. если что не так - откатился. мне нужен был монитор трафика - а он тут как тут в базе. но есть и недоделки. я о них уже в конце топика чисто из интереса пишу и меня за это убивать готовы.

crypt ★★★★★
()
Последнее исправление: crypt (всего исправлений: 6)
Ответ на: комментарий от hibou

Ну и что тут сложного? Читаешь первый байт, в нем заложена инфа о следующих байтах. Если для символа нужны еще байты, читаешь следующие и складываешь из них символ.

Дело в том, что работать с такой строкой неудобно. Не значит, что нельзя, но все же лучше когда один символ - один байт (или фиксированное - 2 или 4).

praseodim ★★★★★
()
Ответ на: комментарий от praseodim

Дело в том, что работать с такой строкой неудобно. Не значит, что нельзя, но все же лучше когда один символ - один байт (или фиксированное - 2 или 4).

Utf8 существует уже 30 лет. Из них лет 15 он является стандартной кодировкой в интернете. Но в C его до сих пор не умеют. Нужно как минимум glib тащить.

hateyoufeel ★★★★★
() автор топика
Ответ на: комментарий от hateyoufeel

Да причем тут умеют или не умеют.

Например, банально захотелось статистику сделать по тексту, количество символов например подсчитать. Или там морфлогией какой посложнее заняться - и все нельзя просто взять и обратиться к массиву по индексу.

Получается, что utf8 - это для обмена информацией или для ненапряжной обработки внутри, а если что-то посерьезнее хочется, то сильно неудобно и быстродействие падает.

Я тут очень медленно пилю кое-какой свой проектик, может когда-нибудь выложу публично, а может так и не дойдет, но не суть. Я для русского текста выбрал для внутренней обработки cp1251 - удобнее всего: один байт на символ и в алфавитном порядке.

praseodim ★★★★★
()
Ответ на: комментарий от praseodim

cp1251 - удобнее всего: один байт на символ и в алфавитном порядке.

А если среди т.н. «русского текста» встретится, например «см²», то?

thunar ★★★★★
()
Ответ на: комментарий от mrdeath

вайфай сеть какашкой назвать?

Сейчас полез проверять… iOS (не какое-то там OpenBSD) до сих пор не даёт на сайтах вводить пароли с Emoji 😮

Я пароли ввожу уже сохранённые в keychain 🔐

2022 год 🤷‍♂️

fornlr ★★★★★
()
Ответ на: комментарий от praseodim

cp1251

какой кошмар... и это linux.org.ru... в XXI веке...

банально

и все нельзя просто взять и обратиться к массиву по индексу.

есть такая фигня. it все сложнее. именно поэтому open source теперь развивается корпорациями. именно поэтому теперь systemd вместо свободного линукса. потому что нельзя просто так взять и сделать! (с) с другой стороны берешь и считаешь границы символов (маркировки). пяти минут не прошло и я это сообразил.

crypt ★★★★★
()
Последнее исправление: crypt (всего исправлений: 1)
Ответ на: комментарий от hateyoufeel

я прочел, что чувак написал драфт еще в 18 году, но не смог попасть на встречу комитета. на встречу C++ попал и протолкнул. а С не повезло.

crypt ★★★★★
()
Ответ на: комментарий от thunar

А если среди т.н. «русского текста» встретится, например «см²», то?

А если еще какой символ? Мне это неважно для моих целей. Немного велосипедю с поиском по тексту и другими его характеристиками.

praseodim ★★★★★
()
Ответ на: комментарий от crypt

какой кошмар... и это linux.org.ru... в XXI веке...

Что удобно, то и используется. В принципе koi8-r тоже можно, но все же отсортированность иногда полезна.

есть такая фигня. it все сложнее. именно поэтому open source теперь развивается корпорациями. именно поэтому теперь systemd вместо свободного линукса. потому что нельзя просто так взять и сделать! (с) с другой стороны берешь и считаешь границы символов (маркировки). пяти минут не прошло и я это сообразил.

Остается вопрос, а зачем мне себе работу усложнять и понижать скорость обработки? Меня устраивает и то, что некоторые символы будут пропущены при преобразовании utf-8 --- cp1251 (koi8-r)

praseodim ★★★★★
()
Ответ на: комментарий от praseodim

ну понимаешь, можно писать хороший код, а можно какой удобно. если писать код для души, то логично, чтобы он был хороший. о каком быстродействии ты говоришь, я вообще не понимаю. если я не готов иметь дело с юникодом, я не использую русский вообще.

crypt ★★★★★
()
Последнее исправление: crypt (всего исправлений: 1)
Ответ на: комментарий от crypt

Мне нужно сравнивать текст с учетом морфологии, да где-то велосипедю нечеткий поиск, но с некоторыми еще условиями. По любому, алгоритмы зависят от языка. И зачем мне там все усложнять юникодом, это мне вообще ничего не даст.

praseodim ★★★★★
()
Ответ на: комментарий от praseodim

серьезно на это отвечать скучно, поэтому я могу только предложить попробовать на раст=) там поди уже есть че-нибудь более современное)

crypt ★★★★★
()
Ответ на: комментарий от crypt

Да, добавлю, что внешняя информация может поступать и в юникоде, вернее в разных кодировках, но в основном utf-8 и cp1251, остальные в следовых количествах. Как и выдаваться в юникоде, но вот внутренняя обработка намного проще, когда однобайтовая

praseodim ★★★★★
()
Ответ на: комментарий от crypt

В принципе, для внутренней обработки можно вообще свою собственную кодировку придумать, просто в этом нет необходимости.

praseodim ★★★★★
()
Ответ на: комментарий от praseodim

если нужно проще, достаточно взять язык, который эту ситуацию обрабатывает из коробки, а не писать какой-то странный код, который я поломаю плохим вводом. я почти уверен, что помести ты это в программерскую ветку, обсмею не только я.

и уж тем более не подобает обсуждать это в ветке про OpenBSD, которая очень радеет за качество кода, а не чтобы удобно.

crypt ★★★★★
()
Последнее исправление: crypt (всего исправлений: 2)
Ответ на: комментарий от crypt

если нужно проще, достаточно взять язык, который эту ситуацию обрабатывает из коробки, а не писать какой-то странный код, который я поломаю плохим вводом. я почти уверен, что помести ты это в программерскую ветку, обсмею не только я.

Ну например, хочется знать такой параметр текста, как частоту встречаемости в нем отдельных букв. В случае однобайтовой кодировки все тривиально пишется черех простой Radix sort.

frequency[text[i]]++; 

Предельно быстро и предельно просто. Зачем искать другой язык? Еще и не уверен, кстати, что такой найдется, вместо массива как минимум будет хэш, а это замедление. Может не всегда критичное, но все же.

praseodim ★★★★★
()
Последнее исправление: praseodim (всего исправлений: 1)
Ответ на: комментарий от praseodim

потому что у тебя будет программа, которая сможет работать не только с русским языком, а с разными, будет современной. это всегда более красиво. поясню на примере. в heroes2 вообще «своя кодировка» - привязка спрайтов букв к алфавиту. смена языка - рисовка новых букв и кодирование текста. в XXI веке это выглядит, как грязный хак. это мое имхо.

crypt ★★★★★
()
Последнее исправление: crypt (всего исправлений: 2)
Ответ на: комментарий от vertexua

Учитывая, что половина местных в 90-х застряла, 2010 — это буквально вчера.

// кодировочки обсуждать с однобайтными лишенцами, вот это проблемы у людей

microdo3nik
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.