LINUX.ORG.RU

Поясните за Си

 , ,


0

3

Накопился ряд вопросов по Си, вываливаю сразу кучей.

1. Как посмотреть весь список типов, известных компилятору в данный момент с учётом включенных заголовочников, объявлений и т. д.?

2. Правильно ли я понимаю, что список собственно типов и структур хранятся отдельно, потому что Foo и struct Foo - разные типы данных и могут сосуществовать в рамках одного проекта?

3. В С11 появилось ключевое слово _Generic, однако ещё со стандарта С99 существует заголовочный файл tgmath.h, который реализует подобное поведение, аналогичное перегрузке функций в С++, для набора математических функций. Как это можно было реализовать в С99?

★★★★★
Ответ на: комментарий от kirk_johnson

У memcpy, если ты не нарушаешь его требований, перечисленных в стандарте — никакого.

В коде на C, который попытается делать то, что делает memcpy, кастуя к char* (или к int* для оптимизации) будет UB в случаях, если попытаться копировать не массивы char (int).

anonymous
()
Ответ на: комментарий от anonymous

В коде на C, который попытается делать то, что делает memcpy, кастуя к char* (или к int* для оптимизации) будет UB в случаях, если попытаться копировать не массивы char (int).

Щитоа?

Copies count bytes from the object pointed to by src to the object pointed to by dest. Both objects are reinterpreted as arrays of unsigned char.

kirk_johnson ★☆
()
Ответ на: комментарий от anonymous

7.21 String handling <string.h> 7.21.1 String function conventions 1 The header <string.h> declares one type and several functions, and defines one macro useful for manipulating arrays of character type and other objects treated as arrays of character type.268) The type is size_t and the macro is NULL (both described in 7.17). Various methods are used for determining the lengths of the arrays, but in all cases a char * or void * argument points to the initial (lowest addressed) character of the array. If an array is accessed beyond the end of an object, the behavior is undefined. 2 Where an argument declared as size_t n specifies the length of the array for a function, n can have the value zero on a call to that function. Unless explicitly stated otherwise in the description of a particular function in this subclause, pointer arguments on such a call shall still have valid values, as described in 7.1.4. On such a call, a function that locates a character finds no occurrence, a function that compares two character sequences returns zero, and a function that copies characters copies zero characters. 3 For all functions in this subclause, each character shall be interpreted as if it had the type unsigned char (and therefore every possible object representation is valid and has a different value). 7.21.2 Copying functions 7.21.2.1 The memcpy function Synopsis 1 #include <string.h> void *memcpy(void * restrict s1, const void * restrict s2, size_t n); Description 2 The memcpy function copies n characters from the object pointed to by s2 into the object pointed to by s1. If copying takes place between objects that overlap, the behavior is undefined. Returns 3 The memcpy function returns the value of s1.

kirk_johnson ★☆
()
Ответ на: комментарий от kirk_johnson

Есть. Читай про «treated as array of character type».

Конкретно вот эту часть:

For all functions in this subclause, each character shall be interpreted as if it had the type unsigned char (and therefore every possible object representation is valid and has a different value)

kirk_johnson ★☆
()
Последнее исправление: kirk_johnson (всего исправлений: 2)
Ответ на: комментарий от kirk_johnson

То, что оно «threated as» и «as if it had» не то же самое, что «ты можешь обращаться в своём коде с любым объектом как массивом символов».

В скобках написано, для чего нужны эти as if: это гарантия, что если у объекта есть trap representation, то при копировании с помощью функций ты не получишь UB, как при копировании объекта со значением, являющимся trap representation, присваиванием.

anonymous
()
Ответ на: комментарий от anonymous

То, что оно «threated as» и «as if it had» не то же самое, что «ты можешь обращаться в своём коде с любым объектом как массивом символов».

Ты можешь привести ситуацию, в которой ты не можешь рассматривать объект как unsigned char *?

kirk_johnson ★☆
()
Последнее исправление: kirk_johnson (всего исправлений: 1)
Ответ на: комментарий от kirk_johnson

Ты можешь привести ситуацию, в которой ты не можешь рассматривать объект как unsigned char*?

Не знаю, что ты понимаешь под «мочь».

Стандарт не даёт права рассматривать произвольный объект как массив unsigned char. Он только говорит, что если их скопировать в массив unsigned char соответствующего размера, то набор байтов в этом массиве будет называться object representation-ом.

anonymous
()
Ответ на: комментарий от anonymous

если их скопировать

если его скопировать

anonymous
()
Ответ на: комментарий от anonymous

Стандарт не даёт права рассматривать произвольный объект как массив unsigned char.

Что это значит? Стандарт утверждает, что любой указатель может быть приведен к void *. void * может быть приведен к unsigned char *, для которого специальным пунктом идет отсутствие trap representation. Более того, char - единица адресации. Так что я не вижу проблемы.

kirk_johnson ★☆
()
Ответ на: комментарий от kirk_johnson

Стандарт утверждает, что любой указатель может быть приведен к void *. void * может быть приведен к unsigned char *

Допустим. Но он не говорит, что этот указатель является (или может считаться для целей адресной арифметики) указателем на первый элемент массива unsigned char[sizeof(объект)].

Так что я не вижу проблемы.

А я вижу. Ты додумываешь то, чего нет.

anonymous
()
Ответ на: комментарий от anonymous

Допустим. Но он не говорит, что этот указатель является (или может считаться для целей адресной арифметики) указателем на первый элемент массива unsigned char[sizeof(объект)].

Эм... char — это минимальный дискрет. Поэтому первый char в массиве по указателю это первый char объекта. Просто потому, что объект адресуется char'ами. Что в этом утверждении противоречит стандарту?

kirk_johnson ★☆
()
Ответ на: комментарий от kirk_johnson

Стандарт говорит, что любой тип, который не является bit field - непрерывныйнабор байт.

Он говорит:

Values stored in non-bit-field objects of any other object type consist of n × CHAR_BIT bits, where n is the size of an object of that type, in bytes.

Это, конечно, educated guess, но я думаю, что «n × CHAR_BIT bits» использовано вместо «n bytes» не случайно, а для того, чтобы сильнее подчеркнуть то, что массивом из bytes это не является.

anonymous
()
Ответ на: комментарий от anonymous

Но он не говорит, что этот указатель является (или может считаться для целей адресной арифметики) указателем на первый элемент массива unsigned char[sizeof(объект)].

Алсо гонишь:

A pointer to an object or incomplete type may be converted to a pointer to a different
object or incomplete type. If the resulting pointer is not correctly aligned57) for the pointed-to type, the behavior is undefined. Otherwise, when converted back again, the result shall compare equal to the original pointer. When a pointer to an object is converted to a pointer to a character type, the result points to the lowest addressed byte of the object. Successive increments of the result, up to the size of the object, yield pointers to the remaining bytes of the object.

kirk_johnson ★☆
()
Последнее исправление: kirk_johnson (всего исправлений: 1)
Ответ на: комментарий от anonymous

будет UB в случаях, если попытаться копировать не массивы char (int)

Неа. POD -> char[] - корректный type aliasing

Deleted
()
Ответ на: комментарий от anonymous

Так... ты стандарт вообще читал?

3.6
1 byte addressable unit of data storage large enough to hold any member of the basic character set of the execution environment 2 NOTE 1 It is possible to express the address of each individual byte of an object uniquely. 3 NOTE 2 A byte is composed of a contiguous sequence of bits, the number of which is implementation- defined. The least significant bit is called the low-order bit; the most significant bit is called the high-order bit. 3.7 1 character 〈abstract〉 member of a set of elements used for the organization, control, or representation of data 3.7.1 1 character single-byte character 〈C〉 bit representation that fits in a byte

kirk_johnson ★☆
()
Последнее исправление: kirk_johnson (всего исправлений: 1)
Ответ на: комментарий от kirk_johnson

Ладно. Значит, в C можно реализовать memcpy без UB.

А в C++даже гарантии, что представление объекта хранится непрерывно, кроме как для trivially copyable types, нет.

anonymous
()
Ответ на: комментарий от anonymous

В C++, с которым я лучше знаком, такой гарантии нет.

может и нет, но невозможно представить ситуацию, когда последовательное приращение адреса первого байта объекта вплоть до его размера внезапно даст указатель на байты другого объекта. возможность такого поведения породила бы другие проблемы и это нашло бы отражение в стандарте

tyro33
()
Ответ на: комментарий от tyro33

Ещё совсем недавно в стандарте была написана странная фраза: «If an object of type T is located at an address A, a pointer of type cv T* whose value is the address A is said to point to that object, regardless of how the value was obtained. [Note: For instance, the address one past the end of an array would be considered to point to an unrelated object of the array's element type that might be located at that address.»

Конечно, это бред и это приводило к противоречиям. Это выкинули, а Note переписали как: «A pointer past the end of an object is not considered to point to an unrelated object of the object's type that might be located at that address.»

anonymous
()
Ответ на: комментарий от kirk_johnson

Со всеми исключениями плюсов, я не могу придумать такого случая. По-моему, такое возможно только с reference types, но там sizeof невозможно определить разумно.

tailgunner ★★★★★
()
Ответ на: комментарий от tailgunner

Со всеми исключениями плюсов, я не могу придумать такого случая. По-моему, такое возможно только с reference types, но там sizeof невозможно определить разумно.

Это так, легкая шпилька в сторону монструозности дизайна плюсов. Я тоже не могу представить себе такой ситуации в реальности.

kirk_johnson ★☆
()
Ответ на: комментарий от kirk_johnson

Successive increments of the result, up to the size of the object, yield pointers to the remaining bytes of the object.

То есть, разрешены только инкременты. Но не прибавления произвольного числа и не декременты.

Ещё кто-то говорит, что C++ — это нагромождение исключений...

anonymous
()
Ответ на: комментарий от tailgunner

Стандарт ISO — это близкий к юридическому документ. По языку, которым он должен писаться («shall» вместо «must» и т.п.) и т.д. Наверняка есть правила писать требования, разрешения и запреты явно, а не оставлять читателю стандарта их вывод по аналогии или ещё как-то.

Ты можешь точно сказать, что это просто неаккуратный wording и подразумевается возможность совершать другие арифметические операции или комитет хотел, чтобы это понимали буквально и декремент — это неопределённое поведение?

anonymous
()
Ответ на: комментарий от anonymous

Ты можешь точно сказать, что это просто неаккуратный wording

Я могу точно сказать, что прибавление произвольного числа выраждается через инкремент (если считать «инкрементом» строго увеличение на единицу).

и подразумевается возможность совершать другие арифметические операции

Естественно.

tailgunner ★★★★★
()
Ответ на: комментарий от anonymous

То есть, разрешены только инкременты. Но не прибавления произвольного числа и не декременты.

Ой все.

kirk_johnson ★☆
()
Ответ на: комментарий от tailgunner

Я могу точно сказать, что прибавление произвольного числа выраждается через инкремент (если считать «инкрементом» строго увеличение на единицу).

Под «точно сказать» я имел в виду «притащить ссылку на Defect Report с ответом от комитета», а не демонстрацию твоих познаний в арифметике.

и подразумевается возможность совершать другие арифметические операции

Естественно.

If a ‘‘shall’’ or ‘‘shall not’’ requirement that appears outside of a constraint or runtime- constraint is violated, the behavior is undefined. Undefined behavior is otherwise indicated in this International Standard by the words ‘‘undefined behavior’’ or by the omission of any explicit definition of behavior.

Посмотри, что значит «explicit». Explicit definition для инкремента указателя после каста есть. То, что декремент даст предыдущий байт объекта — явно не сказано.

Так что тут куча вопросов. Если позиция комитета «байты, образующие представление объекта, это массив символов» — почему они просто и ясно про это не написали? А написали только про то, что после каста можно инкрементом адресовать следующие байты.

Если можно выполнять любые арифметические операции, а эти слова про инкремент — просто напоминание, что при инкременте получается следующий байт, то почему это напоминание — не в (foot)note, как полагается всем информативным, а не нормативным утверждениям?
Такое нормативное явное описание какого-то поведения означает отсутствие явного описания для остального поведения, т.е. делает декременты и проч. операции неопределёнными.

Стандарт C, конечно, написан очень неаккуратно, так что это вполне может быть просто напоминанием, а комитет считает представление объекта массивом, но хотелось бы увидеть эту позицию комитета в ответе на какой-нибудь defect report.

anonymous
()
Ответ на: комментарий от anonymous

Я могу точно сказать, что прибавление произвольного числа выраждается через инкремент

Под «точно сказать» я имел в виду «притащить ссылку на Defect Report

Ну, если тебе нужно явно указывать, что инкремент - это операция прибавления единицы... это печально.

tailgunner ★★★★★
()
Ответ на: комментарий от kirk_johnson

Successive increments of the result, up to the size of the object, yield pointers to the remaining bytes of the object.

Возвращаемся к нашим баранам. Ок, ходить по байтам объекта можно (только «вперёд», используя оператор инкремента — ++, но нам этого достаточно).

Но функция memcpy не только итерирует по объектам, она ещё должна копировать байты. Наверное присваиванием? В memcpy должно быть что-то вроде цикла, который делает число итераций, равное количеству, переданному в третьем аргументе и в теле цикла выполняет что-нибудь вроде

*dst++ = *src++;
, где dst и src это переменные типа unsigned char* и const unsigned char*, полученные из первого и второго аргумента функции, соответственно.

Посмотрим, что стандарт говорит про присваивание:

Draft N1570, 6.5.16.1 Simple assignment

(Constraints я пропущу, там ничего интересного, а копипастить много)

Semantics

2 In simple assignment (=), the value of the right operand is converted to the type of the assignment expression and replaces the value stored in the object designated by the left operand.

3 If the value being stored in an object is read from another object that overlaps in any way the storage of the first object, then the overlap shall be exact and the two objects shall have qualified or unqualified versions of a compatible type; otherwise, the behavior is undefined.

(Дальше идут Examples, которые тоже не важны)

Присваиванием можно копировать только в объекты (replaces the value stored in the object designated by the left operand.), значит тут есть 2 стула:

1. Не считать байты в представлении объекта объектами. Тогда с помощью оператора присваивания копировать эти байты нельзя, семантика не определена.

2. Считать эти байты объектами, но тогда тут проблема с третьим параграфом. Даже если не обращать внимания на «compatible types», а посмотреть на требование «the overlap shall be exact», то ясно, что у объекта размером больше одного байта не будет exact overlap ни с каким байтом в его представлении. Короче, нельзя попеременно писать и читать в объект с помощью присваивания то через выражение типа этого объекта, то через unsigned char, указывающий на какой-то из его байтов.

Если не существует других способов копировать байты в core language, кроме присваивания, то с реализуемостью memcpy на conformant C проблемы.

anonymous
()
Ответ на: комментарий от anonymous

Тут нет проблемы с третьим параграфом, потому что по стандарту и мануалам в memcpy запихиваются non-overlapping объекты. Так что мимо:

is read from another object that overlaps in any way the storage of the first object

Вот не-UB-ID memcpy: https://github.com/codemeow/bixi/blob/master/code/libbixi/utils/bximemutils.c...

По стандарту мы можем присваивать от void * к u8 * и обратно. Тут нарушения нет.

PPP328 ★★★★★
()
Ответ на: комментарий от PPP328

Тут нет проблемы с третьим параграфом, потому что по стандарту и мануалам в memcpy запихиваются non-overlapping объекты.

Вобще я не это имел в виду, но ок, я не корректно понял третий параграф.

anonymous
()
Ответ на: комментарий от anonymous

Ты всего сутки назад узнал, что по байтам объекта можно лазать (Поясните за Си (комментарий)), а разговариваешь таким менторским тоном, как будто сам писал это в стандарт.

Раскусил, я до этого вcегда боялся использовать memcpy из-за UB. Наверное поэтому с работы выгнали.

kirk_johnson ★☆
()
Последнее исправление: kirk_johnson (всего исправлений: 2)
Ответ на: комментарий от kirk_johnson

When a pointer to an object is converted to a pointer to a character type, the result points to the lowest addressed byte of the object.

Как это правильно понимать? Что только при конверсии int* -> unsigned char* мы получим указатель на первый байт объекта int, а при конврсии int* -> void* -> unsigned char* мы получим первый байт объекта void, но не int?

Или при преобразовании int* -> void* результат это не указатель на void, а по-прежнему указатель на int и поэтому последующий каст к unsigned char* дас нам указатель на первый байт объекта int?

anonymous
()
Ответ на: комментарий от anonymous

Любой указатель может быть представлен как void *, а любой void * как T *. Также любой тип суть непрерывный набор байт, потому что типы в C существуют только в момент конпеляции.

kirk_johnson ★☆
()
Последнее исправление: kirk_johnson (всего исправлений: 2)
Ответ на: комментарий от kirk_johnson

Любой указатель может быть представлен как void *, а любой void * как T *.

Очевидно, неверно. Ты же сам копировал со стандарта пару дней назад, а уже не помнишь?

A pointer to an object or incomplete type may be converted to a pointer to a different object or incomplete type. If the resulting pointer is not correctly aligned for the pointed-to type, the behavior is undefined.

Так что если твой «любой void*» некорректно выровнен для T*, то UB.

Но вообще ладно, вопрос мой был не совсем в этом. Внимательно:

When a pointer to an object is converted to a pointer to a character type, the result points to the lowest addressed byte of the object.

Обрати внимание на артикли. Вот мне не до конца понятно, что из этого следует. Что для получения первого байта объекта T нужно обязательно кастовать T* -> unsigned char*, или можно T* -> void* -> unsigned char*?

Если последнее, то это означает, что T* -> void* (и вообще T* -> U*, при условии, что с выравниванием всё ОК) не делает указатель указателем на void (на U), а оставляет его указателем на T.

Тогда значит то, что мне говорили про C++17, является правдой. Что его правила каста указателей не новы (не любой каст указателя меняет значение указателя, где под «значением» понимается «смысл» указателя), а это просто явно сформулированные правила, которые действовали и до C++17. Эти же правила действуют и в C.

anonymous
()
Ответ на: комментарий от anonymous

Что для получения первого байта объекта T нужно обязательно кастовать T* -> unsigned char*, или можно T* -> void* -> unsigned char*?

В С++ только так и можно. Если сделать static_cast<unsigned char*> будешь послан. Придется использовать reinterpret_cast, который ни что иное, как static_cast<void*>
В С можно писать как угодно. Итог у этих операций один. Си работает с байтами, а не с сущностями

tyro33
()
Ответ на: комментарий от anonymous

Очевидно, неверно.

Очевидно, верно. Ты можешь скастовать T * в void * и обратно без потерь.

Обрати внимание на артикли. Вот мне не до конца понятно, что из этого следует. Что для получения первого байта объекта T нужно обязательно кастовать T* -> unsigned char*, или можно T* -> void* -> unsigned char*?

Может программирование — не твое?

kirk_johnson ★☆
()
Последнее исправление: kirk_johnson (всего исправлений: 1)
Ответ на: комментарий от tyro33

Придется использовать reinterpret_cast, который ни что иное, как static_cast<void*>

При этом про static_cast<void*> явно написано, что он не изменяет значения указателя. (и под «значением» понимается не битовое представление адреса).

Вот мне интересно, нет ли аналогичных, но подразумеваемых правил в C? Объяснения комитета под парой Defect Report-ов, которые я прочитал недавно, делают меня думать, что C тоже подразумевает что-то подобное. Т.к. в одном из ответов сказано, что побитового совпадения представления двух указателей недостаточно, чтобы у них было одно и то же значение (указатели одного и того же типа, естественно).

В С можно писать как угодно. Итог у этих операций один.

Я думаю ты это написал не изучив тему подробно, а только на основании твоего скудного опыта использования какой-то одной реализации C на какой-то одной платформе.

anonymous
()
Ответ на: комментарий от kirk_johnson

Очевидно, верно. Ты можешь скастовать T * в void * и обратно без потерь.

Ты написал, что любой void* можно скастовать в любой T*. А теперь оказывается что не любой, а только полученный из T*.

Может программирование — не твое?

А может — не твоё? Ты на простые вопросы ответить не можешь, хотя где-то там программировал на C.

anonymous
()
Ответ на: комментарий от kirk_johnson

Читать научись

Любой указатель может быть представлен как void *, а любой void * как T *

Ты можешь скастовать T * в void * и обратно

Утверждения с разным смыслом.

anonymous
()
Ответ на: комментарий от anonymous

Вот мне интересно, нет ли аналогичных, но подразумеваемых правил в C?

Есть. Называется strict aliasing rule. Актуальны и в С, и в С++.
В твоем примере с приведением к unsigned char* никаких нарушений нет. К указателю на символ можно можно корректно привести указатель любого типа. То же самое относится и к void*. Просто его нельзя кастовать в какой попало T* и использовать адресную арифметику.
Таким образом, касты T* -> unsigned char* и T* -> void* -> unsigned char* в сишке дадут одинаковый результат

Я думаю ты это написал не изучив тему подробно, а только на основании твоего скудного опыта использования какой-то одной реализации C на какой-то одной платформе.

Речь идет о касте именно в unsigned char*, а не T*. Но ты можешь привести в пример платформу, где не работает какой-нибудь memcpy, например. Оно как раз принимает void*, а оперирует unsigned char*, хе хе

tyro33
()
Ответ на: комментарий от tyro33

А толку, в стандарте прописано, что ты обязан предоставить возможность итерироваться по чарам. Я, честно говоря, даже не могу себк представить платформу, на которой этого бы не давали сделать.

kirk_johnson ★☆
()
Последнее исправление: kirk_johnson (всего исправлений: 1)
Ответ на: комментарий от kirk_johnson

Я, честно говоря, даже не могу себк представить платформу, на которой этого бы не давали сделать.

Что-нибудь с тегированной памятью. Интересно, как memcpy сделана на Эльбрусе.

tailgunner ★★★★★
()
Ответ на: комментарий от tyro33

Есть. Называется strict aliasing rule. Актуальны и в С, и в С++.

Опять 25... Откуда вы все лезете? strict aliasing rules это не правила приведения указателей. Хватит путать тёплое с мягким.

По правилам string aliasing можно получать доступ к объекту через lvalue символьного типа. Отсюда не следует, что указатель на объект можно кастовать к указателю на символьный тип. Для этого нужно отдельное правило. В C такое правило есть. А в C++ из указателя на объект получить указатель на байт(ы) его стораджа, видимо, нельзя. Но правило, разрешающее доступ через символьный тип, там есть.

Таким образом, касты T* -> unsigned char* и T* -> void* -> unsigned char* в сишке дадут одинаковый результат

«результат» в смысле «значение»? То есть, если указатель указывал на объект T и имел тип T*, то после каста к void* он по-прежнему указывает на T, и после последующего каста к unsigned char* мы получим указатель, который указывает на первый байт объекта T?

Но ты можешь привести в пример платформу, где не работает какой-нибудь memcpy,

Какая бы платформа ни была, в корректной реализации стандарта C на этой платформе memcpy не может «не работать» просто по определению.
Вопрос был в реализуемости memcpy на переносимом C. Способном работать на любой «платформе» с поведением, не противоречащим стандарту, каким бы извращённым оно ни было по сравнению с поведением на существующих платформах.

anonymous
()
Ответ на: комментарий от tailgunner

Что-нибудь с тегированной памятью.

Что-нибудь вроде реализации C в каком-нибудь прувере/формальном верификаторе.

anonymous
()
Ответ на: комментарий от tailgunner

в любом прувере будет модель memcpy

Сделай без неё.

формальный прувер - это не платформа.

А что такое платформа?

anonymous
()
Ответ на: комментарий от anonymous

в любом прувере будет модель memcpy

Сделай без неё.

Смысла нет. Впрочем, тебе уже показали реализацию memcpy на переносимом Си. То, что она тебя не устраивает - твои личные тараканы.

А что такое платформа?

ISA.

tailgunner ★★★★★
()
Ответ на: комментарий от tailgunner

То, что она тебя не устраивает - твои личные тараканы.

С чего ты взял, что она меня не устраивает?

anonymous
()
Ответ на: комментарий от tailgunner

А что такое платформа?

ISA.

В контексте реализуемости C платформа это любая реализация абстрактной машины C. Так что прувер вполне себе платформа.

anonymous
()
Ответ на: комментарий от anonymous

В контексте реализуемости C платформа это любая реализация абстрактной машины C

Ты имеешь полное право считать платформой то, что сам захочешь - прувер, ветвер, да хоть калах. А я буду считать платформой именно ISA.

tailgunner ★★★★★
()
Ответ на: комментарий от tailgunner

Что-нибудь с тегированной памятью. Интересно, как memcpy сделана на Эльбрусе.

Гм... да точно так же, там glibc в «официальном» дистрибутиве. Можно ядерный глянуть, вдруг меняли. У меня вроде остались сырцы где-то :D

kirk_johnson ★☆
()
Последнее исправление: kirk_johnson (всего исправлений: 1)
Ответ на: комментарий от anonymous

Опять 25... Откуда вы все лезете? strict aliasing rules это не правила приведения указателей. Хватит путать тёплое с мягким.

Угу, strict aliasing про то, в каких случаях законно обращаться к объекту через lvalue другого типа. Действительно, причем же тут приведения?
Блин, тут даже компиляторы при кривых кастах ругаются на «dereferencing pointer does break strict-aliasing rules». Авторы, наверное, тоже путают теплое с мягким, лол :)

По правилам string aliasing можно получать доступ к объекту через lvalue символьного типа. Отсюда не следует, что указатель на объект можно кастовать к указателю на символьный тип.

Следует, иначе зачем такие гарантии для символьного типа вообще нужны

Для этого нужно отдельное правило. В C такое правило есть. А в C++ из указателя на объект получить указатель на байт(ы) его стораджа, видимо, нельзя. Но правило, разрешающее доступ через символьный тип, там есть.

В отличии от С, в С++ подобный доступ возможен только через явное приведение:

int buf[100];
char* n = buf; //С - ok, C++ - compilation failed

А раз доступ без приведения сделать невозможно, то разрешение доступа подразумевает в данном случае и разрешение приведения.

мы получим указатель, который указывает на первый байт объекта T?

В Си - да. Физически это будет первый байт объекта T. В С++ хз

tyro33
()
Ответ на: комментарий от kirk_johnson

Что-нибудь с тегированной памятью. Интересно, как memcpy сделана на Эльбрусе.

Гм... да точно так же

Точно так же с тегами не получится. Может, читать байт из середины float и разрешено, но чтобы было разрешено писать его в середину float - сомневаюсь. На lowrisc memcpy/memmove специальный.

там glibc в «официальном» дистрибутиве

Возможно, теговая защита памяти обычно отключена.

tailgunner ★★★★★
()
Ответ на: комментарий от tailgunner

Точно так же с тегами не получится.

Я наискосок посмотрел документацию по tagged memory — теги хранятся в отдельной зоне и доступ к ним через отдельные инструкции. Или я что-то упускаю?

Возможно, теговая защита памяти обычно отключена.

Заинтересовал. Попробую вечером потыкать.

kirk_johnson ★☆
()
Последнее исправление: kirk_johnson (всего исправлений: 1)
Ответ на: комментарий от kirk_johnson

Я наискосок посмотрел документацию по tagged memory — теги хранятся в отдельной зоне и доступ к ним через отдельные инструкции. Или я что-то упускаю?

Не знаю, где хранятся теги, но доступ к ним (и, вероятно, в обход них) наверняка делается специальными инструкциями, и в memcpy/memmove должны использоваться именно они. Правда, я не могу так сразу придумать, что будет, если, например, memcpy cкопирует половину float в другой float (можно придумать и другие приколы - пол-указателя, например).

tailgunner ★★★★★
()
Ответ на: комментарий от tailgunner

Не знаю, где хранятся теги, но доступ к ним (и, вероятно, в обход них) наверняка делается специальными инструкциями, и в memcpy/memmove должны использоваться именно они. Правда, я не могу так сразу придумать, что будет, если, например, memcpy cкопирует половину float в другой float (можно придумать и другие приколы - пол-указателя, например).

Судя по тому, что чуваки пишут «поддержка тегированной памяти пока что для тестовых целей» — ничего страшного не случится.

The implementation of tagged memory presented here provides only basic support by extending on-chip caches to hold tags and by adding a tag cache. Instruction set support is provided for testing in the form of load and store tag (ltag, stag) instructions. Future releases will add hardware support for particular security policies (e.g. generating an exception upon modifying data tagged as read-only) and Linux kernel support.

kirk_johnson ★☆
()
Последнее исправление: kirk_johnson (всего исправлений: 1)
Ответ на: комментарий от tyro33

Угу, strict aliasing про то, в каких случаях законно обращаться к объекту через lvalue другого типа. Действительно, причем же тут приведения?

Ни при чём.

Блин, тут даже компиляторы при кривых кастах ругаются на «dereferencing pointer does break strict-aliasing rules». Авторы, наверное, тоже путают теплое с мягким, лол :)

Это ты путаешь casting и dereferencing.

Следует, иначе зачем такие гарантии для символьного типа вообще нужны

А раз доступ без приведения сделать невозможно, то разрешение доступа подразумевает в данном случае и разрешение приведения.

Какая-то странная логика. Точнее, её отсутствие.
«Объявление о продаже апартаментов за 100 млн. подразумевает, что у меня появились в кармане 100 млн., иначе зачем такое объявление?»

Как можно считать, что разрешение приведения подразумевается, когда явно (не подразумеваемо) написано, что каст к unsigned char* не даст указателя на unsigned char?

anonymous
()
16 февраля 2019 г.
Ответ на: комментарий от tailgunner

инкремент - это операция прибавления единицы...

И каким образом это разрешает любые арифметические операции?

Сдвиг беззнакового числа влево (E1 << E2) на число битов равное (или большее) числу битов в левом агрументе это UB, хотя 2 сдвига на половину от числа битов это не UB. Хотя вроде бы это «одно и то же» по своему конечному эффекту.

Так и разрешение инкрементов (прибавления единицы) не разрешает автоматически прибавления двух и т.д.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.