saahriktu был прав! Дырки через юникод везде! Мы все погибнем!

saahriktu был прав

Эдик же.

Zhbert ★★★★★
(01.11.21 12:27:52 MSK)

Ссылка

Красота. С каждым годом дырки веселее.

wandrien ★★★
(01.11.21 12:29:51 MSK)

Ссылка

вариация на supply chain attack

Неинтересно.

intelfx ★★★★★
(01.11.21 12:36:14 MSK)

Ссылка

для Ъ: с помощью Юникода в код можно впихивать дырки которые фиг заметишь!

Надеюсь, через эмодзи?

Zhbert ★★★★★
(01.11.21 12:38:02 MSK)

Ссылка

Надеюсь через эмоджи черного беременного мужика?

~~Im_not_a_robot~~ ★★★★★
(01.11.21 12:39:29 MSK)

Ответ на: комментарий от Im_not_a_robot 01.11.21 12:39:29 MSK

эмоджи черного беременного мужика

Такой есть?

Zhbert ★★★★★
(01.11.21 12:47:08 MSK)

Ответ на: комментарий от Zhbert 01.11.21 12:47:08 MSK

Зачем быть таким отсталым и непрогрессивным?

https://emojipedia.org/pregnant-man-dark-skin-tone/

~~Im_not_a_robot~~ ★★★★★
(01.11.21 12:50:05 MSK)

Ответ на: комментарий от Im_not_a_robot 01.11.21 12:50:05 MSK

PWND!

wandrien ★★★
(01.11.21 12:56:06 MSK)

Ссылка

Ответ на: комментарий от Im_not_a_robot 01.11.21 12:50:05 MSK

WAIT OH SHI~

~~hateWin~~ ★☆
(01.11.21 13:03:25 MSK)

Ссылка

Ответ на: комментарий от Im_not_a_robot 01.11.21 12:50:05 MSK

…

Zhbert ★★★★★
(01.11.21 13:04:36 MSK)

Ссылка

Ответ на: комментарий от Im_not_a_robot 01.11.21 12:50:05 MSK

Ну кто такие ссылки даёт 😡

http://📙.la/🫃🏿

fornlr ★★★★★
(01.11.21 13:21:54 MSK)

Ссылка

Ух, неприятно. Глядишь, какой-нибудь юморист прочитавший эту новость возьмёт, да решит побаловаться этой дыркой.

Irben ★★★
(01.11.21 22:15:13 MSK)

Ссылка

Знакомые программисты на Дельфи обсуждали подобный прикол году в 2018-м. Или когда Дельфи стало полностью юникодным. Если я правильно понял, в следующей версии что-то запретили, и подобное стало невозможным.

А за несколько лет до того по той же причине предупреждали не копипастить команды в sudo bash со Stack Overflow.

question4 ★★★★★
(01.11.21 22:30:13 MSK)

Ссылка

Проблема не в юникоде, а в том, что компиляторы принимают на вход что-то шире множества отображаемых символов из первых 127.

t184256 ★★★★★
(01.11.21 23:08:50 MSK)

которые фиг заметишь!

В Visual Studio показываются нормализированные исходники.

То есть там ты заметишь, так как явно будет видно что закоментировано и прочее.

Например про символы 0 длины показывается warning:

identifier contains Unicode character <U+200B> that is invisible in some environments

Но код компилируется, так как код остается валидным.

fsb4000 ★★★★★
(02.11.21 02:56:26 MSK)

Ссылка

https://www.opennet.ru/opennews/art.shtml?num=56083

ashot ★★★★
(02.11.21 03:40:50 MSK)

Ссылка

Ответ на: комментарий от t184256 01.11.21 23:08:50 MSK

а если я хочу эмодзи в интерфейсе программы отображать

Harald ★★★★★
(02.11.21 03:52:04 MSK)

Ответ на: комментарий от Harald 02.11.21 03:52:04 MSK

🚶⤳🍆

t184256 ★★★★★
(02.11.21 04:05:16 MSK)

Ответ на: комментарий от t184256 02.11.21 04:05:16 MSK

~~fernandos~~, тут ⬆️⬆️⬆️ 5.2!

Harald ★★★★★
(02.11.21 04:12:18 MSK)

Ответ на: комментарий от Harald 02.11.21 04:12:18 MSK

Товарищ hobbit, тут травля снова. Сделайте что нибудь!

~~NAY_GIGGER~~
(02.11.21 04:26:45 MSK)

Ссылка

С опеннета:

Метод основан на применении в комментариях к коду специальных Unicode-символов, меняющих порядок отображения двунаправленного текста. При помощи подобных управляющих символов одни части текста могут выводиться слева-направо, а другие справа-налево. В повседневной практике подобные управляющие символы могут применяться, например, для вставки в файл с кодом строк на иврите или арабском языке. Но если комбинировать строки с разным направлением текста в одной строке, при помощи указанных символов отрывки текста, отображаемые справа-налево могут перекрыть уже имеющийся обычный текст, отображаемый слева-направо.

В процессе рецензирования кода разработчик столкнётся с визуальным порядком вывода символов и увидит в современном текстовом редакторе, web-интерфейсе или IDE не вызывающий подозрения комментарий, но компилятор и интерпретатор будет использовать логический порядок символов и обработает вредоносную вставку как есть, не обращая внимание на двунаправленный текст в комментарии.

Вообще, конечно, и смех, и грех. Наверное, ситуацию, когда одни видимые символы могут перекрывать другие, надо считать некорректной. И в редакторах кода, по крайней мере, надо предусмотреть режим, в котором такие строки выделяются красным цветом для привлечения внимания. Думаю, это не очень сложно.

Также по прочтении стало интересно, а как же поступают для добропорядочной вставки строк на иврите в код? Сначала добавляют энное количество пробелов с расчётом на будущий текст, а потом пишут сам текст?

P.S. Вот именно по схожей причине мне не нравится синтаксис питона. Там, конечно, не Trojan Source, максимум — логика программы сломается. Но сама идея зависимости работы программы от невидимых символов — плохая.

hobbit ★★★★★
(02.11.21 06:24:24 MSK)

Ответ на: комментарий от hobbit 02.11.21 06:24:24 MSK

Также по прочтении стало интересно, а как же поступают для добропорядочной вставки строк на иврите в код? Сначала добавляют энное количество пробелов с расчётом на будущий текст, а потом пишут сам текст?

Проблема не в этом. По-моему, они там криво всё объяснили.

Расскажу, как сам думаю.

В памяти все данные идут «от начала к концу» во всех языках. Вот только визуальное положение положение «начала» и «конца» у разных языков разное. Вот что получается:

Допустим, у нас есть последовательность байт: «abcde ABCDE xyz». При этом заглавные буквы в этом примере означают какие-то буквы иврита.

Движок видит, что начало абзаца идёт в направлении LTR. Он начинает выстраивать глифы по порядку: «abcde».

Потом он встречает «A» и понимает, что нужно переключиться на RTL. Она заглядывает дальше и смотрит, сколько их там: «ABCDE». Кончились.

Теперь он рассчитывает глифы. Получает визуально слово: «EDCBA».

Добавляет его к уже построенной строке глифов: «abcde EDCBA».

Дальше идёт переключение на LTR.

В результате получается: «abcde EDCBA xyz».

Это правильный результат рендеринга. Никакого бага — последовательность символов на экране не соответствует порядку в файле. Так и задумано!

А теперь — проблема. Используя коды принудительной смены направления, можно в наши «ABCDE» из примера загнать самые разные символы, а не только буквы иврита!

Вот и получится что визуально кусок текста будет, например, закомментирован. А на самом деле — нет!

wandrien ★★★
(02.11.21 07:44:10 MSK)
Последнее исправление: wandrien 02.11.21 07:46:26 MSK (всего исправлений: 3)

Ссылка

Ответ на: комментарий от hobbit 02.11.21 06:24:24 MSK

Ну и вот тут смотри еще: https://www.w3.org/International/articles/inline-bidi-markup/uba-basics

Существует направление фрагмента и существует более общее направление в рамках абзаца/строки.

Это позволяет атакующему разбить строку на фрагменты и визуально переупорядочить их так, чтобы «закомментированный» текст оказался раскоментированным и наоборот.

Даже примеры из статьи на w3.org по сути уже готовая атака, просто никому ранее в голову не приходило подставить туда нужные символы.

wandrien ★★★
(02.11.21 08:02:26 MSK)
Последнее исправление: wandrien 02.11.21 08:02:59 MSK (всего исправлений: 2)