А почему умерли разные типы указателей?

1

2

Привет, ЛОР!

Тащемта, вопрос. В x86-16 были near и far pointers, что позволяло экономить на размере указателя в ту глубокую древность. Почему этот концепт не попал в 64-битные архитектуры? Ведь с учётом локальности, делать все указатели 64-битными выходит в конский расход памяти при том, что большая часть бит указателей в рамках одного экземпляра структуры данных (допустим, связанный список или дерево) будут одинаковыми. А значит, можно сэкономить кучу памяти, сохраняя только последние N бит указателя и хранить полный указатель, например, только в заголовке структуры данных.

В общем, вариантов как это может облегчить жизнь просто вагон. Почему этого сейчас нет нигде?

Update:

Вообще, такой подход дохрена где применяется. Гуглить «succinct data structures». Например, вот это: https://web.archive.org/web/20160312010342/https://www.computer.org/csdl/proceedings/focs/1989/1982/00/063533.pdf

Но мой вопрос скорее про то, почему этого нет на уровне языков/компиляторов.

←	Ошибка сборки AOSP

Ищу набор тестов для проверки парсера UTF-8

→

← 1 2 3 →

Если кратко, то потому что память очень дешёвая, а нативной поддержки коротких указателей в процах не заявлено.

В линуксах есть архитектура x32 где 32-битные указатели и 64-битные данные, но она оказалась невостребованной.

Другие варианты это делать это всё вручную - ну, сделай в своих прогах и расскажешь как впечатления. Иногда даже делают - заменяя просто указатели на индексы в каком-нить пуле, так можно не только старшие биты сэкономить, но и младшие (т.к. нет смысла указывать на середину объекта).

firkax ★★★★★
(17.01.25 16:53:22 MSK)

Что мешает программно генерировать адрес из индекса?

anonymous
(17.01.25 16:53:24 MSK)

Ответ на: комментарий от anonymous 17.01.25 16:53:24 MSK

У него вопрос не в том как это сделать, а почему никто так не делает.

firkax ★★★★★
(17.01.25 16:53:58 MSK)

near pointers отсчитывались не от структуры данных, а от адреса, на который указывает сегметный регистр.

То есть соотвествовали некоей (спорной) аппаратной фиче.

В других архитектурах такой аппаратной фичи нет. А чисто программно - её можно и умулировать. Завести указатель-переменную base, и прибавлять к ней int32-индексы.

GPFault ★★★
(17.01.25 16:54:18 MSK)

Скорее всего из-за размера регистров и требований выравнивания.
Под капотом маленькие указатели никуда не делись, если у тебя не large memory model конечно - в коде генерируется вместо полного 64битного указателя 32 или даже 16битный оффсет, чтобы уменьшить размер инструкции, а чтобы сделать такое же в данных - обычно явно использует оффсет (например, записав индекс вместо сырого указателя в структуру)
Абсолютные малые указатели бессмысленны в эпоху 64битного адресного пространства и ASLR. Да, можно было бы сделать какой-нибудь специальный тип, в который компилятор писал бы оффсет, но оффсет от чего это должен быть? Раньше это был оффсет от начала сегмента, но никто не хочет возвращаться к сегментной памяти. Сегменты сейчас разве что для TLS используют.
Осталось правда одно применение, где малые указатели были бы полезны - это прослойки вроде Wow64 в wine. и одна их реализаций даже патчила clang чтобы добавить туда такие типы. Но даже там судя по всему от этого отказались, просто обернув всё в nt-сисколы

mittorn ★★★★★
(17.01.25 16:55:39 MSK)

Ответ на: комментарий от GPFault 17.01.25 16:54:18 MSK

near pointers отсчитывались не от структуры данных, а от адреса, на который указывает сегметный регистр.

Да, я в курсе.

В других архитектурах такой аппаратной фичи нет. А чисто программно - её можно и умулировать. Завести указатель-переменную base, и прибавлять к ней int32-индексы.

Ага. Но почему так не делает никто? Я хочу понять, стоит ли тратить время на реализацию такого или же экономия памяти обернётся конскими тормозами.

hateyoufeel ★★★★★
(17.01.25 16:55:42 MSK) автор топика

Ответ на: комментарий от mittorn 17.01.25 16:55:39 MSK

Под капотом маленькие указатели никуда не делись, если у тебя не large memory model конечно - в коде генерируется вместо полного 64битного указателя 32 или даже 16битный оффсет, чтобы уменьшить размер инструкции, а чтобы сделать такое же в данных - обычно явно использует оффсет (например, записав индекс вместо сырого указателя в структуру)

Что ты несёшь? Если я открою дамп памяти любого процесса, там везде будут полные указатели в динамической памяти. Относительная адресация в коде меня мало заботит.

hateyoufeel ★★★★★
(17.01.25 16:56:58 MSK) автор топика

Ответ на: комментарий от firkax 17.01.25 16:53:22 MSK

помимо индексов в пуле, можно ещё сегменты адресовать, это должно быть быстрее. Но никто это не использует т.к работать с этим сильно сложнее чем с 64 битами, проще потратить чуть больше памяти

mittorn ★★★★★
(17.01.25 16:57:14 MSK)

Ответ на: комментарий от firkax 17.01.25 16:53:58 MSK

в смысле? Многие работают с массивами, многие используют как индексы байты, слова, двойные слова.

anonymous
(17.01.25 16:57:41 MSK)

Ответ на: комментарий от GPFault 17.01.25 16:54:18 MSK

Да, кстати, код расчитанный на сегментную память нельзя будет портировать на другую архитектуру. Можно конечно TLS регистры вместо сегментов использовать, но фактически они не для этого

mittorn ★★★★★
(17.01.25 16:58:05 MSK)
Последнее исправление: mittorn 17.01.25 16:58:35 MSK (всего исправлений: 1)

Очень хорошо, что оно сдохло!
Это костыль к сегментно-страничной интеловской организации памяти которая появилась в 286 процессоре.

Эти уродские указатели — адский геморрой!
Как сравнивать нормальный и уродский указатели?
Как отслеживать переполнения смещения при арифметических операциях?

А значит, можно сэкономить кучу памяти, сохраняя только последние N бит указателя и хранить полный указатель, например, только в заголовке структуры данных.

Храни указатель на область и смещение в этой области, если ты хочешь экономии памяти на указателях.

vel ★★★★★
(17.01.25 16:58:30 MSK)

Если коротко - экономия не стоит затраченных усилий.

m0xf ★
(17.01.25 16:58:50 MSK)

Ответ на: комментарий от hateyoufeel 17.01.25 16:56:58 MSK

Это только в коде и сделано для упрощения кодирования инструкций, в памяти оно нахрен никому не сдалось

mittorn ★★★★★
(17.01.25 17:00:01 MSK)

Ответ на: комментарий от hateyoufeel 17.01.25 16:55:42 MSK

Конскими вряд ли, но будет наверно чуть медленнее. И дело не только в тормозах, сравни:

  i = *st->p;

  i = *(int32*)(st->base+st->p);

Второе мало того что просто длиннее и засоряет экран, оно ещё и лишает тебя возможности нормально проверять типы на этапе компиляции. А еще у тебя сразу возникают вопросы:

1) а где хранить base, в этой же структуре или в какой-то другой?

2) а какой битности делать короткие указатели и что делать если вдруг её не хватит?

3) что делать если вдруг указатель из одного места надо скопировать в другое где другое base? рефакторить всю прогу чтоб он стал «far»?

firkax ★★★★★
(17.01.25 17:09:12 MSK)

Ответ на: комментарий от vel 17.01.25 16:58:30 MSK

Сегментация памяти, ближние и дальние указатели и соответствующие модели памяти появились в 8086.

anonymous
(17.01.25 17:09:41 MSK)

Ответ на: комментарий от vel 17.01.25 16:58:30 MSK

сегментно-страничной интеловской организации памяти которая появилась в 286 процессоре.

Дважды враньё. Ни сегменты, ни страницы не появились в 286. Сегменты появили раньше, страницы - позже.

firkax ★★★★★
(17.01.25 17:11:31 MSK)

Почему этот концепт не попал в 64-битные архитектуры?

И хорошо, что не попал. Не хочу возвращаться в те времена.

pathfinder ★★★★
(17.01.25 17:11:38 MSK)

Почему этого сейчас нет нигде?

Потому что так проще? Я имею в виду есть 64-битная архитектура с 32 битными указателями, но мало кто хочет с этим возится.

vbcnthfkmnth123 ★★★★★
(17.01.25 17:13:26 MSK)

Ответ на: комментарий от hateyoufeel 17.01.25 16:55:42 MSK

у нынешних «ойтишнегов» чо, мания какая-то усложнять себе жизнь? разработчики дали им компилятор - пиши! пиши софт, блджад! нет, не хочу, хочу считать смещения вручную.

anonymous
(17.01.25 17:13:29 MSK)

Ответ на: комментарий от pathfinder 17.01.25 17:11:38 MSK

Не надо так категорично, иногда используется, но всё-таки редко. И вполне себе на пользу.

firkax ★★★★★
(17.01.25 17:15:38 MSK)

Помянем x32abi. Причины: «как это поможет мне в моем дедлайне на javascript», «я [s]художник[/s] кампутер сцаентист а не байтоёб, нинужно», «компьютеры сейчас быстрые(кстати почему мой калькулятор на электроне тормозит?)» и тд.

anonymous
(17.01.25 17:17:02 MSK)

Ответ на: комментарий от anonymous 17.01.25 17:13:29 MSK

Он и пишет компилятор. Человек поставил себе задачу сделать язык программирования более всратый чем C.

anonymous
(17.01.25 17:17:06 MSK)

Ответ на: комментарий от firkax 17.01.25 17:15:38 MSK

Вот кому надо, пускай тот берет в руки int16_t (или int8_t) и «энергично манипулирует руками над клавиатурой».

pathfinder ★★★★
(17.01.25 17:20:52 MSK)
Последнее исправление: pathfinder 17.01.25 17:21:04 MSK (всего исправлений: 1)

Ответ на: комментарий от firkax 17.01.25 17:09:12 MSK

Второе мало того что просто длиннее и засоряет экран, оно ещё и лишает тебя возможности нормально проверять типы на этапе компиляции. А еще у тебя сразу возникают вопросы:

Это сишные проблемы. В нормальном языке это убирается под капот и не отсвечивает.

а где хранить base, в этой же структуре или в какой-то другой?

Не так важно.

а какой битности делать короткие указатели и что делать если вдруг её не хватит?

Опять же, не так важно. Это деталь реализации. Меня волнует жизнеспособность подхода.

hateyoufeel ★★★★★
(17.01.25 17:25:47 MSK) автор топика

Ответ на: комментарий от anonymous 17.01.25 17:17:06 MSK

Ты меня с wandrien путаешь, анон. Я языков не пишу.

hateyoufeel ★★★★★
(17.01.25 17:26:09 MSK) автор топика

Ответ на: комментарий от hateyoufeel 17.01.25 17:26:09 MSK

Насколько я помню анонимус считает тебя его виртуалом или типа того.

vbcnthfkmnth123 ★★★★★
(17.01.25 17:27:34 MSK)
Последнее исправление: vbcnthfkmnth123 17.01.25 17:27:55 MSK (всего исправлений: 1)

Ответ на: комментарий от anonymous 17.01.25 17:17:02 MSK

Помянем x32abi.

x32abi позволял ТОЛЬКО 32-битные указатели. Мой вопрос про возможность комбинирования 32-битных и 64-битных в одном и том же процессе.

hateyoufeel ★★★★★
(17.01.25 17:30:08 MSK) автор топика

Ответ на: комментарий от hateyoufeel 17.01.25 17:25:47 MSK

Это не детали реализации, а очень существенные вопросы, без ответа на которые такие указатели смысла иметь не будут. А поскольку даже ты, как мы видим, не захотел утруждать себя ответом на них, по понятно почему короткие указатели популярность не получили.

firkax ★★★★★
(17.01.25 17:31:04 MSK)

Ответ на: комментарий от firkax 17.01.25 17:31:04 MSK

Это не детали реализации

Это детали реализации.

очень существенные вопросы, без ответа на которые такие указатели смысла иметь не будут.

Окей, вот тебе пример: в качестве основного указателя берётся указатель на саму структуру/заголовок/первый элемент, засовывается в регистр, а все остальные указатели внутри структуры отсчитываются от него.

Для многих случаев это снизит расход памяти весьма существенно.

понятно почему короткие указатели популярность не получили.

Нет, непонятно.

hateyoufeel ★★★★★
(17.01.25 17:34:49 MSK) автор топика

Ответ на: комментарий от firkax 17.01.25 16:53:22 MSK

Если кратко, то потому что память очень дешёвая, а нативной поддержки коротких указателей в процах не заявлено.

Память может и дешёвая, а какой-нибудь кеш первого уровня не очень.

vbr ★★★★★
(17.01.25 17:40:49 MSK)

Ответ на: комментарий от vbr 17.01.25 17:40:49 MSK

Память может и дешёвая, а какой-нибудь кеш первого уровня не очень.

Память-то дешёвая, но не бесконечная. У меня были такие случаи, когда в каком-нибудь raidix-tree большая часть памяти памяти была забита указателями, а совсем не данными, и приходилось ручками переписывать в нечто более приличное. И мне кажется, такая проблема встречается на самом деле достаточно часто.

hateyoufeel ★★★★★
(17.01.25 17:43:26 MSK) автор топика

Ответ на: комментарий от hateyoufeel 17.01.25 17:30:08 MSK

В принципе она есть на большинстве архитектур.
Например, слинкованный (с помощью llvm и такой-то матери) 32битный x86 код в 64 бинарь функционирует (при условиии конечно, что бинарь загружен в нижние 32 бита). На arm это должен быть aarch64 код, не aarch32, даже если 32битный т.к aarch64 и aarch32 несовместимы. llvm умеет с таким работать, а вот clang/gcc уже нет. Но это не far/near указатели, это просто малые указатели относительно нуля

mittorn ★★★★★
(17.01.25 17:43:55 MSK)

Ответ на: комментарий от hateyoufeel 17.01.25 17:34:49 MSK

в качестве основного указателя берётся указатель на саму структуру/заголовок/первый элемент, засовывается в регистр, а все остальные указатели внутри структуры отсчитываются от него.

Ещё аллокатор памяти надо дорабатывать для этого, либо структуру выделять сразу большим блоком чтобы влезла не только сама структура, как описано в хедере, но и всё что для неё динамически выделено. Учесть надо будет ещё и то, что иногда данные структуры надо будет менять, соответственно либо заранее выделить запас помяти под возможные добавки расходов места, либо делать realloc на весь выделенный блок ради того чтобы какую-нить строку по указателю изменить с «abc» до «abcd». Разумеется, это всё решаемо, но большинство программистов не хотят заниматься решением данных вопросов, они хотят чтобы всё просто работало (пока не упираются в узкое место по памяти). Я, там где надо экономить память, делал и это и кастомные аллокаторы, но обычно тоже просто использую обычные указатели.

firkax ★★★★★
(17.01.25 17:45:07 MSK)

Ответ на: комментарий от firkax 17.01.25 17:45:07 MSK

Разумеется, это всё решаемо, но большинство программистов не хотят заниматься решением данных вопросов, они хотят чтобы всё просто работало (пока не упираются в узкое место по памяти)

Я тебе расскажу большую тайну: большинство программистов вообще управлением памяти не занимаются, за них это делает GC. Который в том числе может учитывать локальность.

hateyoufeel ★★★★★
(17.01.25 17:46:29 MSK) автор топика

Ответ на: комментарий от hateyoufeel 17.01.25 17:43:26 MSK

Вот да, когда есть огромная таблица со связанными строками, имеет смысл делать связи по индексам (это лучше чем короткие указатели), а не по указателям. Но это частный случай, конкретно он решается просто, да.

firkax ★★★★★
(17.01.25 17:46:44 MSK)

мммм, любитель всратой адресации и короткой шины, изыди, чур чур :))))

Morin ★★★★★
(17.01.25 17:47:39 MSK)

Ответ на: комментарий от hateyoufeel 17.01.25 17:46:29 MSK

Пиши тогда новую java vm с автоматическим использованием локальных указателей, посмотрим что получится (мне кажется ничего хорошего).

firkax ★★★★★
(17.01.25 17:47:47 MSK)
Последнее исправление: firkax 17.01.25 17:48:35 MSK (всего исправлений: 1)

Ответ на: комментарий от firkax 17.01.25 17:46:44 MSK

Вот да, когда есть огромная таблица со связанными строками, имеет смысл делать связи по индексам (это лучше чем короткие указатели), а не по указателям. Но это частный случай, конкретно он решается просто, да.

Таких случаев бывает вагон. Я серьёзно думаю, что очень здоровая часть расходов на память в софте сегодня – сраные указатели.

Возьми тот же наивный парсинг JSON ради примера: обычно его парсят в AST с самыми обычными указателями. При этом, размер данных в каждой ноде может быть сильно меньше размеров указателей в ней же. Типа, какое-нибудь { "tag": [1,2,3,4] } будет иметь ~36 байт полезных данных (4 инта по 64 бита (да, я знаю что в JS float, ну да насрать), строка на 3 байта, её размер, мб что ещё по мелочи) и пачку указателей, по одному на каждый элемент массива, на сам массив и т.д. и т.п. В итоге получается полная жопа по части объёмов памяти.

Я как-то раз делал бенч с немного вырожденным JSON: тупо объект на 10 миллионов полей, имя и значение каждого поля – строка на 5 символов. Например, { "aaaaa": "11111", "aaaab": "11112", ... }. Получается файлик мегабайт на 15. При этом, даже jsoncpp отожрал порядка 150 метров, чтобы его распарсить. Всякие жабы и хацкелли отжирали по полгига. Вот настолько вот всё херово, чувак.

Часто ли парсится JSON в современном софте? Мне почему-то кажется, что очень часто.

hateyoufeel ★★★★★
(17.01.25 17:55:07 MSK) автор топика

Ответ на: комментарий от hateyoufeel 17.01.25 17:55:07 MSK

Часто ли парсится JSON в современном софте? Мне почему-то кажется, что очень часто.

В такоем случае прийдется вместо одной функции которая работает только с 64 битными указателями делать несколько: с 8, 16, 24, 32 и т.д. указателями. А если будет смесь? Значит надо действовать через интерфейс, а это значит что вместо прямого вызова функций нужно будет использовать косвенный вызов через промежуточный указатель а это лишнее замедление. И если памяти сейчас дохрена, две планки памяти сейчас дают 96 гигов. То вот производительность однопоточная в лучшем случае на пару процентов каждый год растет.

V1KT0P ★★
(17.01.25 17:59:33 MSK)

Ответ на: комментарий от V1KT0P 17.01.25 17:59:33 MSK

В такоем случае прийдется вместо одной функции которая работает только с 64 битными указателями делать несколько: с 8, 16, 24, 32 и т.д. указателями.

Нет, не придётся.

И если памяти сейчас дохрена, две планки памяти сейчас дают 96 гигов.

Этот аргумент работает только если у тебя отдельный компьютер под каждую программу.

И если памяти сейчас дохрена, две планки памяти сейчас дают 96 гигов.

Покажи мне как ты вставляешь две планки памяти в средний макбук.

hateyoufeel ★★★★★
(17.01.25 18:01:12 MSK) автор топика

Ответ на: комментарий от hateyoufeel 17.01.25 17:55:07 MSK

Ну и? Такого, что ты скомпилируешь json-парсер магическим компилятором и он вдруг станет в 5 раз меньше жрать - не выйдет.

Можешь оптимизировать парсер и его структуры данных, а ещё лучше оптимизировать софт, который этим парсером пользуется. Потому что если кто-то хранит в json-е мегабайты данных то проблема в архитектуре.

firkax ★★★★★
(17.01.25 18:01:13 MSK)

Ответ на: комментарий от hateyoufeel 17.01.25 18:01:12 MSK

(оффтоп)

Этот аргумент работает только если у тебя отдельный компьютер под каждую программу.

В идеале так и должно быть, кстати.

Покажи мне как ты вставляешь две планки памяти в средний макбук.

А макбуки не нужны.

firkax ★★★★★
(17.01.25 18:02:39 MSK)

Ответ на: комментарий от firkax 17.01.25 18:01:13 MSK

Ну и? Такого, что ты скомпилируешь json-парсер магическим компилятором и он вдруг станет в 5 раз меньше жрать - не выйдет.

Магии конечно не выйдет, код придётся править. Мой вопрос в том, почему этого вообще никто не делает. Ну то есть, за исключением «succinct data structures», которые я упомянул в верхнем посте и которые встречаются примерно почти нигде, я подвижек таких не видел.

Потому что если кто-то хранит в json-е мегабайты данных то проблема в архитектуре.

ТЫ НЕ ПОВЕРИШЬ! Но так делают почти все. Так вышло, что JS стал фактически стандартом де-факто для хранения и передачи данных в индустрии.

Этот аргумент работает только если у тебя отдельный компьютер под каждую программу.

В идеале так и должно быть, кстати.

Охлол.. сколько у тебя компьютеров дома? Десять? Двадцать? Тридцать?

hateyoufeel ★★★★★
(17.01.25 18:03:47 MSK) автор топика
Последнее исправление: hateyoufeel 17.01.25 18:05:55 MSK (всего исправлений: 2)

Ответ на: комментарий от hateyoufeel 17.01.25 18:01:12 MSK

Нет, не придётся.

В смысле нет? Ты заранее не знаешь размер json который надо парсить а значит и размер указателей либо выбираешь самый большой либо через интерфейс. Плюс если парсинг это часть программы то выделенная память может превысить 4 гига, а значит если хочешь маленькие указатели то надо через base+offset что снова приводит к замедлению.

V1KT0P ★★
(17.01.25 18:06:06 MSK)

Ответ на: комментарий от hateyoufeel 17.01.25 18:03:47 MSK

Мой вопрос в том, почему этого вообще никто не делает.

Потому что веб-макаки (а js разносят именно они) вообще мало что умеют.

ТЫ НЕ ПОВЕРИШЬ! Но так делают почти все.

Верю ещё как. Да, у почти всех проблема в архитектуре. И оптимизацию тут надо начинать не с укорачивания указателей в json-парсере а с выкидывания json-парсера целиком и замены формата на статический или почти статический бинарный.

firkax ★★★★★
(17.01.25 18:06:11 MSK)
Последнее исправление: firkax 17.01.25 18:09:19 MSK (всего исправлений: 1)

Ответ на: комментарий от hateyoufeel 17.01.25 18:03:47 MSK

(оффтоп)

Охлол.. сколько у тебя компьютеров дома? Десять? Двадцать? Тридцать?

Два на рабочем столе, ещё 6 в стойке. И да, ни на одном из них загрузка и близко не 100%, разделение по железу именно ради структуризации работы.

firkax ★★★★★
(17.01.25 18:07:47 MSK)

Ответ на: комментарий от V1KT0P 17.01.25 18:06:06 MSK

Ты заранее не знаешь размер json который надо парсить

чо? Прочитал JSON, засунул в буфер, парсишь.

Плюс если парсинг это часть программы то выделенная память может превысить 4 гига, а значит если хочешь маленькие указатели то надо через base+offset что снова приводит к замедлению.

Что значит «может»? Она либо превысит, либо не превысит. В любом случае, это не выглядит невыполнимой проблемой и я навскидку могу предложить пару способов как это решить.

hateyoufeel ★★★★★
(17.01.25 18:08:14 MSK) автор топика

Ответ на: комментарий от firkax 17.01.25 18:07:47 MSK

Два на рабочем столе, ещё 6 в стойке. И да, ни на одном из них загрузка и близко не 100%, разделение по железу именно ради структуризации работы.

То есть, ты используешь всего 8 программ? Одна из них – браузер, какие остальные 7?

Не, я понимаю, конечно, что ты полную херню написал. Ты постоянно так делаешь, за это мы тебя и любим на этом форуме.

hateyoufeel ★★★★★
(17.01.25 18:09:13 MSK) автор топика

Ответ на: комментарий от hateyoufeel 17.01.25 18:08:14 MSK

чо? Прочитал JSON, засунул в буфер, парсишь.

И какой размер указателя ты предлашаешь для этого использовать?

могу предложить пару способов как это решить.

Так предложи который не просадит производительность и удобство разработки.

V1KT0P ★★
(17.01.25 18:09:57 MSK)

Ответ на: комментарий от hateyoufeel 17.01.25 18:09:13 MSK

Нет, программ больше 8. Недоработка, да.

firkax ★★★★★
(17.01.25 18:09:57 MSK)

← 1 2 3 →

←	Ошибка сборки AOSP

Development

Ищу набор тестов для проверки парсера UTF-8

→

Похожие темы