Чистота кода

Ответ на: комментарий от hobbit 14.03.17 20:42:58 MSK

Qt ориентируется на гуи, не должно быть его в STL

next_time ★★★★★
(14.03.17 21:27:48 MSK)

Ответ на: комментарий от dzidzitop 14.03.17 21:26:16 MSK

http://en.cppreference.com/w/cpp/string/byte/isdigit

Notes

isdigit and isxdigit are the only standard narrow character classification functions that are not affected by the currently installed C locale. although some implementations (e.g. Microsoft in 1252 codepage) may classify additional single-byte characters as digits.

next_time ★★★★★
(14.03.17 21:30:13 MSK)

Ответ на: комментарий от anonymous 14.03.17 10:21:53 MSK

Я не занимаюсь коммерческим программированием на C++ и могу себе позволить вылизывать не «горячий» код с точки зрения производительности. Любой string который владеет своим внутренним буфером на протяжении всего времени жизни самого string в любом случае будет иметь оверхэд на ненужные копирования.

Код на результат так не пишут, и Qt там, вероятно, устраивает программистов по соотношению (результат * производительность)/гемор.

~~dzidzitop~~ ★★
(14.03.17 21:32:05 MSK)

Ответ на: комментарий от next_time 14.03.17 21:30:13 MSK

тут нет ни слова про ASCII. а вот линк поинтереснее

https://gcc.gnu.org/bugzilla/show_bug.cgi?id=18785

~~dzidzitop~~ ★★
(14.03.17 21:33:50 MSK)

Ссылка

Ответ на: комментарий от next_time 14.03.17 21:30:13 MSK

http://www.open-std.org/jtc1/sc22/wg14/www/docs/n1124.pdf

5.2.1 - ничего ни про ASCII ни про соотношение между source charset & execution charset

~~dzidzitop~~ ★★
(14.03.17 21:41:23 MSK)

Ответ на: комментарий от dzidzitop 14.03.17 21:32:05 MSK

Любой string который владеет своим внутренним буфером на протяжении всего времени жизни самого string в любом случае будет иметь оверхэд на ненужные копирования.

const string& же

next_time ★★★★★
(14.03.17 21:50:46 MSK)

Ответ на: комментарий от next_time 14.03.17 21:20:37 MSK

Именно utf8.

и что там с языками типа арабского, с обратной последовательностью символов?

А что с ними?

~~RazrFalcon~~ ★★★★★
(14.03.17 21:51:20 MSK)

Ответ на: комментарий от next_time 14.03.17 21:27:48 MSK

Ага, особенно QtCore, который копирует пол std.

~~RazrFalcon~~ ★★★★★
(14.03.17 21:52:03 MSK)

Ответ на: комментарий от dzidzitop 14.03.17 21:32:05 MSK

в любом случае будет иметь оверхэд на ненужные копирования

У вас странное представление о RAII. Никто не мешает использовать implicit/explicit sharing, COW, как в Qt, и не будет никакого оверхеда.

~~RazrFalcon~~ ★★★★★
(14.03.17 21:53:42 MSK)

Ответ на: комментарий от dzidzitop 14.03.17 21:32:05 MSK

устраивает программистов по соотношению (результат * производительность)/гемор

Просто в реальных задачах не уследить за памятью.

~~RazrFalcon~~ ★★★★★
(14.03.17 21:54:40 MSK)

Ссылка

Ответ на: комментарий от next_time 14.03.17 21:50:46 MSK

чтобы создать const string & из строкового литерала или из C строки, которую вернёт какой-нибудь драйвер базы, нужно сделать аллокацию памяти и скопировать строку в std::string. Поэтому для таких случаев и вводят в C++17 std::string_view.

~~dzidzitop~~ ★★
(14.03.17 21:58:02 MSK)

Ссылка

Ответ на: комментарий от dzidzitop 14.03.17 21:41:23 MSK

про соотношение между source charset & execution charset

написано.

про ASCII

действительно, не написано. но я не знаю другой живой кодировки, соотв. указанному стандарту и неявляющейся надмножеством ASCII. А именно, наличие непечатаемого \0, английского алфавита и «The representation of each member of the source and execution basic character sets shall fit in a byte», «In the basic execution character set, there shall be control characters representing alert, backspace, carriage return, and new line»

EBCDIC мёртв давно

next_time ★★★★★
(14.03.17 21:58:57 MSK)

Ответ на: комментарий от RazrFalcon 14.03.17 21:53:42 MSK

Будет оверхэд по циклам и памяти на счётчик ссылок и на создание внутненнего массива символов из C строк или любых не QT строк.

Отсутствие оверхэда - это полностью такой же машинный код что с использованием, что без использования фичи.

~~dzidzitop~~ ★★
(14.03.17 22:00:06 MSK)

Ответ на: комментарий от RazrFalcon 14.03.17 21:52:03 MSK

там всякие вектора и листы, сделанные хуже чем в стд.

единственное, что из куте можно было бы заимствовать в стд это строки и файлы с директориями.

next_time ★★★★★
(14.03.17 22:01:35 MSK)

Ответ на: комментарий от next_time 14.03.17 21:58:57 MSK

Не написано ничего путного. Кодировка времени компиляции IBM866 и EBCDIC во время выполнения ни к чему хорошему не приведут. Но хорошо что можно проверять соответствие кодировки на совместимость с ASCII во время компиляции и смело писать код, который заточен строго под него. А рантайм поддержать можно уже каким-нибудь iconv или I/O, который заточен на тот или иной вариант репрезентации юникода.

EBCDIC жив в смысле дополнительного гемора по обеспечению сферической портабельности в вакууме на уровне исходного кода.

~~dzidzitop~~ ★★
(14.03.17 22:04:42 MSK)

Ответ на: комментарий от RazrFalcon 14.03.17 21:51:20 MSK

кстати, глянул доки раст, они противоречат вашим словам:

«Because strings are valid UTF-8, they do not support indexing»

https://doc.rust-lang.org/book/strings.html

next_time ★★★★★
(14.03.17 22:07:41 MSK)

Ответ на: комментарий от next_time 14.03.17 21:27:48 MSK

Qt ориентируется на гуи

Опять двадцать пять...

Qt - это модульный фреймворк, в котором большинство модулей (включая гуи, разумеется) необязательны. Единственный обязательный модуль - это QtCore. И помимо GUI, там есть модули для кроссплатформенной работы с сетью, XML, БД и т.д. Если выкинуть QtGui/QtWidget, на остальном вполне можно написать сетевой сервер, например.

hobbit ★★★★★
(14.03.17 22:08:02 MSK)

Ответ на: комментарий от next_time 14.03.17 21:03:15 MSK

А что там написано?

utf8nowhere ★★★
(14.03.17 22:10:13 MSK)

Ссылка

Ответ на: комментарий от dzidzitop 14.03.17 21:32:05 MSK

Любой string который владеет своим внутренним буфером на протяжении всего времени жизни самого string в любом случае будет иметь оверхэд на ненужные копирования.

QString поддерживает COW.

hobbit ★★★★★
(14.03.17 22:10:54 MSK)

Ответ на: комментарий от dzidzitop 14.03.17 22:00:06 MSK

Раз уж на то пошло, то и в самописных лисапедах оверхеды. Только неизвестно, чего от них ожидать

tyro33
(14.03.17 22:11:11 MSK)

Ответ на: комментарий от dzidzitop 14.03.17 22:04:42 MSK

EBCDIC жив в смысле дополнительного гемора по обеспечению сферической портабельности в вакууме на уровне исходного кода.

Не нужно. Текстом следует считать только то, что соответствует хотя бы какому-нибудь стандарту юникод или его подмножеству.

next_time ★★★★★
(14.03.17 22:11:14 MSK)

Ответ на: комментарий от hobbit 14.03.17 20:42:58 MSK

авторы Qt сделали то, чем могла бы стать STL

Авторы Qt постарались сделать Java из C++. Динамическая память, подсчет ссылок и позднее связывание во все поля. Естественно, это противоречит идее STL и самого C++ с его zero-cost.

anonymous
(14.03.17 22:13:42 MSK)

Ссылка

Ответ на: комментарий от hobbit 14.03.17 22:08:02 MSK

только это всё либо ненужно в стд, либо сделано хуже, чем в стд

исключения строки, файлы с директориями, и вот да, работа с сетью ещё

next_time ★★★★★
(14.03.17 22:14:30 MSK)

Ссылка

Ответ на: комментарий от dzidzitop 14.03.17 22:00:06 MSK

Если вам действительно нужно считать каждую аллокацию и вы уверены, что у вас не будет невалидных указателей и утечек - то вперёд.

~~RazrFalcon~~ ★★★★★
(14.03.17 22:21:15 MSK)

Ответ на: комментарий от next_time 14.03.17 22:01:35 MSK

там всякие вектора и листы, сделанные хуже чем в стд.

Чем хуже?

~~RazrFalcon~~ ★★★★★
(14.03.17 22:21:40 MSK)

Ответ на: комментарий от next_time 14.03.17 22:07:41 MSK

Because strings are valid UTF-8, they do not support indexing

По-моему вы просто не поняли сути этой фразы.

Есть String::chars() для индексации по символам, а не байтам.

~~RazrFalcon~~ ★★★★★
(14.03.17 22:23:00 MSK)

Ответ на: комментарий от hobbit 14.03.17 20:42:58 MSK

Нет, всё проще, просто авторы Qt сделали то, чем могла бы стать STL

ё-маё, либо вы латентный читатель этой книжки, либо дезориентация левого полушария мозга попросту заразна))

Qt и STL - библиотеки. C++ - язык. Хотя вы все равно не поймете ;)

anonymous
(14.03.17 22:24:02 MSK)

Ответ на: комментарий от hobbit 14.03.17 22:08:02 MSK

Единственный обязательный модуль - это QtCore.

Даже больше. Начиная с Qt5 QtCore умеет bootstrap версию, где выключено очень многое. Тот же qmake собирается именно с ним, статически.

~~RazrFalcon~~ ★★★★★
(14.03.17 22:24:27 MSK)

Ссылка

Ответ на: комментарий от next_time 14.03.17 21:20:37 MSK

именно utf8?

да, именно utf8. Поэтому нельзя индексировать по символам (это не имеет смысла в utf8), только итерировать. Если тебе так важно ходить по индексу то можешь построить массив символов и ходить по нему:

let chars = text.chars().collect::<Vec<char>>();

тип char имеет размер 32бита (потому что 16бит не хватает, это ты и сам знаешь), так что в худшем случае увеличишь размер в памяти в 4 раза.

что там с языками типа арабского,

Вот сылка на песочницу, можешь сам посмотреть: https://is.gd/Ug6xLP

pftBest ★★★★
(14.03.17 22:26:44 MSK)

Ссылка

Ответ на: комментарий от RazrFalcon 14.03.17 22:21:40 MSK

не умеет конвертится из std::initializer list, не хватает каких-то алгоритмов из stl (деталей не помню и, может, в 5-ке уже починили)

next_time ★★★★★
(14.03.17 22:28:59 MSK)

Ответ на: комментарий от RazrFalcon 14.03.17 22:23:00 MSK

Есть String::chars()

некрасиво, мне именно индексация нужна, причём, без обещанного оверхеда

next_time ★★★★★
(14.03.17 22:31:28 MSK)

Ответ на: комментарий от RazrFalcon 14.03.17 22:21:40 MSK

QVector::push_back уже научился работать с типами без конструктора по-умолчанию?

Begemoth ★★★★★
(14.03.17 22:38:17 MSK)

Ответ на: комментарий от next_time 14.03.17 22:28:59 MSK

В 5-ке есть конструктор из std::initializer_list.

Begemoth ★★★★★
(14.03.17 22:42:51 MSK)

Ссылка

Ответ на: комментарий от anonymous 14.03.17 22:24:02 MSK

Qt и STL - библиотеки. C++ - язык.

И как это противоречит тому, что я написал?

Хотя вы все равно не поймете ;)

Куда уж мне, лол.

hobbit ★★★★★
(14.03.17 22:46:12 MSK)

Ответ на: комментарий от hobbit 14.03.17 22:46:12 MSK

Куда уж мне, лол.

ну хоть это ты понял)

anonymous
(14.03.17 22:48:04 MSK)

Ссылка

Ответ на: комментарий от next_time 14.03.17 22:28:59 MSK

не умеет конвертится из std::initializer list

Это как?

initializer_list начиная с 5-ки умеет

~~RazrFalcon~~ ★★★★★
(14.03.17 22:48:08 MSK)
Последнее исправление: RazrFalcon 14.03.17 22:50:04 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от next_time 14.03.17 22:31:28 MSK

Индексация чего? Байт или символов?

без обещанного оверхеда

Какого оверхеда? При работе с utf-8 всё равно будут расходы.

~~RazrFalcon~~ ★★★★★
(14.03.17 22:48:50 MSK)
Последнее исправление: RazrFalcon 14.03.17 22:49:25 MSK (всего исправлений: 1)

Ответ на: комментарий от Begemoth 14.03.17 22:38:17 MSK

Нет. Оно нужно?

~~RazrFalcon~~ ★★★★★
(14.03.17 22:49:46 MSK)

Ответ на: комментарий от RazrFalcon 14.03.17 22:49:46 MSK

Да.

Begemoth ★★★★★
(14.03.17 22:56:12 MSK)

Ссылка

Ответ на: комментарий от hobbit 14.03.17 22:10:54 MSK

COW не поддерживает передачу владения от C string к QT string без копирования.

~~dzidzitop~~ ★★
(14.03.17 23:33:35 MSK)

Ссылка

Ответ на: комментарий от tyro33 14.03.17 22:11:11 MSK

Да. Лишь бы результат удовлетворял. Поэтому против QT ничего не имею.

~~dzidzitop~~ ★★
(14.03.17 23:34:25 MSK)

Ссылка

Ответ на: комментарий от next_time 14.03.17 22:11:14 MSK

Согласен, это достаточно безопасная на сегодня стратегия написания квазипортабельного кода.

~~dzidzitop~~ ★★
(14.03.17 23:35:13 MSK)

Ссылка

Ответ на: комментарий от RazrFalcon 14.03.17 22:21:15 MSK

Да я на досуге, когда есть вдохновение, этим и занимаюсь. Результаты впечатляют, к слову. Например, уменьшить количество аллокаций в три раза за средний запуск программы, из которых большинство - в сторонних библиотеках или просто необходимы.

~~dzidzitop~~ ★★
(14.03.17 23:36:42 MSK)

Ответ на: комментарий от dzidzitop 14.03.17 23:36:42 MSK

Я об этом же. Если у вас тормоза на аллокациях - то у вас какая-то уже слишком низкоуровневая задача.

~~RazrFalcon~~ ★★★★★
(14.03.17 23:50:48 MSK)

Ссылка

Ответ на: комментарий от RazrFalcon 14.03.17 22:48:50 MSK

к слову, если не задана нормальная форма NFKC или NFC, то любой UTF (хоть UTF-32) не позволяет random access по символам. Codepoints - это не символы. Вот тут есть подробности:

http://unicode.org/reports/tr15/#Norm_Forms

Хорошо хоть в большинстве случаев серьёзной обработкой текстов заморачиваться не нужно.

~~dzidzitop~~ ★★
(15.03.17 00:13:14 MSK)

Ответ на: комментарий от RazrFalcon 14.03.17 22:48:50 MSK

Индексация символов

Какого оверхеда? «But, because each character in a UTF-8 encoded string can be multiple bytes, you have to walk over the string to find the nᵗʰ letter of a string. This is a significantly more expensive operation, and we don’t want to be misleading.» вот этого

необязательны лишние расходы. скажем, любую utf8 строку можно внутрипрограммно представить как utf32 строку, а там уже индексация очень быстрая.

next_time ★★★★★
(15.03.17 00:28:33 MSK)

Ответ на: комментарий от dzidzitop 15.03.17 00:13:14 MSK

Codepoints - это не символы.

это уже философский вопрос, что считать символом

перевод строки в ascii - это символ?

next_time ★★★★★
(15.03.17 00:30:30 MSK)

Ответ на: комментарий от next_time 15.03.17 00:30:30 MSK

Перевод строки ('\n') в процесс разбора текста проблем никаких не приносит. А вот различные формы репрезентации в одном и том же Unicode разных там źćčšŭł - это уже интереснее. Если работать в подпространстве ASCII - то жить легко и просто в любом UTF. А если работать с Unicode текстом на любом более-менее семантическом уровне разбора «символов» - появляются нюансы.

чему равен sizeof(u32"Ščytok")?

чему равен sizeof(u"ой-ё-ёй")?

ответ - зависит от того, в какой форме сохранён этот текст.

~~dzidzitop~~ ★★
(15.03.17 00:34:49 MSK)
Последнее исправление: dzidzitop 15.03.17 00:38:20 MSK (всего исправлений: 2)

Ответ на: комментарий от DELIRIUM 13.03.17 12:42:13 MSK

Фигасе. Я иногда обратный эффект видел. На хабре даже комментарии были, где iostreams разгоняли лучше *f-ов.

Deleted
(15.03.17 00:47:26 MSK)
Последнее исправление: merhalak 15.03.17 00:47:36 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от d_a 13.03.17 16:17:28 MSK

Они сейчас активно интегрируются с C++11 и новее. Так что там не Ад и Израиль.

Deleted
(15.03.17 00:49:57 MSK)
Последнее исправление: merhalak 15.03.17 00:50:46 MSK (всего исправлений: 1)

Ссылка

Похожие темы