Отложенное освобождение памяти

3

3

Как известно, в стандартной библиотеке C++ есть умный указатель с подсчётом ссылок std::shared_ptr; при желании можно думать о любом другом указателе с подсчётом ссылок, смысл дальнейшего от этого не изменится.

Как известно, при достижении счётчиком ссылок нуля вызывается deleter для указателя, управляемого shared_ptr-ом. По-умолчанию deleter просто применят оператор delete к указателю.

На что я хочу обратить внимание: работу по вызову деструктора и освобождению памяти делает тот тред и тот код, который сбрасывает счётчик до нуля. Если объект содержит другие shared_ptr в качестве своих полей, то часто освобождение этого объекта вызывает каскад освобождений памяти и приводит к задержкам в выполнении треда. Пример кода, могущий привести к таким каскадным высвобождениям, можно найти, например, тут https://bartoszmilewski.com/2013/11/13/functional-data-structures-in-c-lists/. Там односвязные иммутабельные списки, для предотвращения копирования всего списка при модификации, например, только головы, реализованы с использованием shared_ptr и могут иметь общие хвосты. Короче, с помощью shared_ptr реализуется persistence, я думаю вы знакомы с таким подходом.

Я тут подумал и пришёл к такой идее: завести threadsafe очередь для указателей (точнее, для структур, содержащих указатель + указатель на функцию, знающую что с этим указателем делать, ведь нам придётся стереть типы; но это уже детали) и при создании shared_ptr использовать custom deleter, который при вызове будет просто помещать указатель в очередь. Вызывать же деструкторы и освобождать память будет отдельный поток (или потоки?). Он будет брать очередной указатель из очереди и вызывать для него деструктор и освобождать память. Так мы избавим рабочие потоки от необходимости обслуживать каскады высвобождений памяти.

Я понимаю, что у этого подхода тоже будут performance penalties. Обычно куч всего несколько и при большом числе тредов каждая обслуживает несколько тредов. И если тред-освободитель будет освобождать память, он захватит лок у кучи, в которую могут лезть треды для выделения памяти. Там-то они и будут сталкиваться лбами. Это я понимаю. Но, в отличие от гарантированных длинных задержек, вызванных каскадным высвобождением памяти, тут задержки будут размазаны во времени или будут «распределены» между другими тредами, если они полезут выделять память в момент освобождения; или же, очень вероятно, эти задержки вообще не проявятся, если память выделять не полезут. Надо тестировать под различными нагрузками, заранее трудно сказать.

А что ЛОР про это думает? Дискас.

Ссылка

←	Не получается отправить письмо

вопрос о перенаправлении типа «<».

→

← 1 2 →

Попробуй для начала tcmalloc

pon4ik ★★★★★
(25.12.16 22:03:53 MSK)

Ответ на: комментарий от pon4ik 25.12.16 22:03:53 MSK

jemalloc

fixed

annulen ★★★★★
(25.12.16 22:24:07 MSK)

Вообще «отложенное освобождение памяти» - это GC

annulen ★★★★★
(25.12.16 22:24:37 MSK)

Ответ на: комментарий от annulen 25.12.16 22:24:37 MSK

И reference counting - тоже GC.

tailgunner ★★★★★
(25.12.16 22:25:44 MSK)

Ответ на: комментарий от annulen 25.12.16 22:24:37 MSK

Только в C++ его нет. (inb4: boehm gc)

dependent_type
(25.12.16 22:26:29 MSK) автор топика

Ссылка

Ответ на: комментарий от tailgunner 25.12.16 22:25:44 MSK

И scope-based memory management — тоже GC.

dependent_type
(25.12.16 22:30:09 MSK) автор топика

Ответ на: комментарий от tailgunner 25.12.16 22:25:44 MSK

Иногда складывается такое ощущение, что у тебя всегда под рукой «Справочник Единственно-Верных Толкований Терминов™».

i-rinat ★★★★★
(25.12.16 22:31:42 MSK)

Обычно куч всего несколько и каждая обслуживает несколько тредов. И если тред-освободитель будет освобождать память, он захватит лок у кучи, в которую лезть треды для выделения памяти. Там-то они и будут сталкиваться лбами.

Это зависит от реализации, у каждого треда может быть по локальному кешу или кучке. Хорошо если создание тяжёлого объекта происходит вне обрабатывающего потока, тогда delete спокойно можно вынести в любой другой поток. В общем, такие схемы точечно используются и бывают даже специальные аллокаторы в которых одни потоки только берут память для определённых типов объектов, а другие только отдают через очередь или хитрые механизмы смещения хвоста в большом кольцевом буфере.

Это, кстати, может быть полезно для работы с большими кусками памяти для которых malloc(...) и free(...) превращаются в тяжёлые mmap(...) и munmap(...) или если объект в принципе имеет тяжёлый деструктор с какой-то логикой.

~~mashina~~ ★★★★★
(25.12.16 22:33:46 MSK)

Ссылка

Ответ на: комментарий от dependent_type 25.12.16 22:30:09 MSK

Это мнение мне пока не встречалось. Я склонен считать его неверным.

tailgunner ★★★★★
(25.12.16 22:39:50 MSK)

Ссылка

Ответ на: комментарий от i-rinat 25.12.16 22:31:42 MSK

Примерно так и есть.

tailgunner ★★★★★
(25.12.16 22:40:35 MSK)

Ответ на: комментарий от tailgunner 25.12.16 22:25:44 MSK

Cool story, bro

annulen ★★★★★
(25.12.16 22:55:14 MSK)

Ссылка

Ответ на: комментарий от tailgunner 25.12.16 22:40:35 MSK

Тебя обманули. Такой книги нет.

i-rinat ★★★★★
(25.12.16 23:00:11 MSK)

Ответ на: комментарий от i-rinat 25.12.16 23:00:11 MSK

Я дал клятву не показывать эту книгу целиком, но вот одна глава из нее.

tailgunner ★★★★★
(25.12.16 23:14:38 MSK)

Ответ на: комментарий от tailgunner 25.12.16 23:14:38 MSK

Тебя всё же обманули. Настоящая книга у меня. Но она настолько секретна, что показать я могу только одну страницу http://rgho.st/private/86ZysZkxZ/1bf20060eaa19a0e11d1bf89f42ecd30

dependent_type
(25.12.16 23:49:00 MSK) автор топика

Ссылка

То, что ТС отписался от собственного треда, символизирует.

Можно не продолжать.

Pavval ★★★★★
(26.12.16 00:32:38 MSK)

Ссылка

Ответ на: комментарий от tailgunner 25.12.16 23:14:38 MSK

Ну спасибо. Теперь в моём списке к прочтению не 300, а 301 ссылка.

i-rinat ★★★★★
(26.12.16 01:00:38 MSK)

Ответ на: комментарий от i-rinat 26.12.16 01:00:38 MSK

Правильный порядок чтения - вот что важно.

tailgunner ★★★★★
(26.12.16 01:35:38 MSK)

Ответ на: комментарий от tailgunner 26.12.16 01:35:38 MSK

Статья на эту тему 151-я в списке.

i-rinat ★★★★★
(26.12.16 01:38:59 MSK)

Ссылка

я недавно смотрел https://www.youtube.com/watch?v=tzVaJhQxAb0
ничё не понял ни из поста ТС, ни из видео, но там list не лочится и всё такое

system-root ★★★★★
(26.12.16 03:30:51 MSK)
Последнее исправление: system-root 26.12.16 03:31:31 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от tailgunner 25.12.16 22:25:44 MSK

И reference counting - тоже GC.

А луна - это солнце. Нет, все же подсчет ссылок к GC не относится. Скорее, полуавтоматическая система управления памятью

~~dave~~ ★★★★★
(26.12.16 09:09:30 MSK)

Ответ на: комментарий от annulen 25.12.16 22:24:07 MSK

А что, оно обьективно лучше?

pon4ik ★★★★★
(26.12.16 10:55:10 MSK)

Ссылка

Ответ на: комментарий от dave 26.12.16 09:09:30 MSK

все же подсчет ссылок к GC не относится

Не относится кем именно? Ссылка выше.

tailgunner ★★★★★
(26.12.16 11:19:05 MSK)

Ответ на: комментарий от tailgunner 26.12.16 11:19:05 MSK

О, да! Кто-то статейку написал, и давайте теперь синее называть голубым

~~dave~~ ★★★★★
(26.12.16 11:47:15 MSK)

Ответ на: комментарий от tailgunner 26.12.16 11:19:05 MSK

По ссылке выше перечень возможных принципов работы GC, в том числе и на базе подсчета ссылок. Тебе осталось показать, что shared_ptr имеют к этим GC отношение.

eao197 ★★★★★
(26.12.16 12:20:17 MSK)

Ответ на: комментарий от pon4ik 25.12.16 22:03:53 MSK

Или http://tlsf.baisoku.org

andreyu ★★★★★
(26.12.16 12:28:31 MSK)

Ответ на: комментарий от eao197 26.12.16 12:20:17 MSK

Тебе осталось показать, что shared_ptr имеют к этим GC отношение.

Зачем и к каким «этим»? Я говорил о подсчете ссылок как о технике. Но shared_ptr - тоже сборка мусора.

tailgunner ★★★★★
(26.12.16 12:54:31 MSK)

Ответ на: комментарий от tailgunner 26.12.16 12:54:31 MSK

Я говорил о подсчете ссылок как о технике.

Я понял.

Но shared_ptr - тоже сборка мусора.

Ну вот и не очевидно, что shared_ptr — это сборка мусора. Ибо:

- сборка мусора не требует явного участия программиста. Если GC работает на основе подсчета ссылок, то инкременты/декременты должен расставлять в нужных местах сам компилятор. В случае же shared_ptr все делается вручную (посредством явного декларирования ссылок через shared_ptr);

- сборка мусора должна справляться с циклами в ссылках без участия программиста. Иначе от «сборки мусора» остается только название. В случае же с shared_ptr разруливание циклических ссылок лежит на программисте. Т.е. имеет место именно что ручная работа с памятью.

Оба эти фактора не позволяют с практической точки зрения считать shared_ptr механизмом сборки мусора. Хотя, если троллить оппонентов посредством банальной эрудиции, то можно и shared_ptr сборкой мусора обозвать.

eao197 ★★★★★
(26.12.16 13:08:11 MSK)

Ответ на: комментарий от eao197 26.12.16 13:08:11 MSK

сборка мусора не требует явного участия программиста. Если GC работает на основе подсчета ссылок, то инкременты/декременты должен расставлять в нужных местах сам компилятор.

Инкременты и декременты? Их и расставляет компилятор.

В случае же shared_ptr все делается вручную (посредством явного декларирования ссылок через shared_ptr);

Garbage-collected ссылка объявляется вручную, да. Потому что есть выбор - использовать GC или нет. Принципиально это не отличается от двух видов ссылок в C++/CLI или даже @nogc в D.

сборка мусора должна справляться с циклами в ссылках без участия программиста

В Perl5 и Python 1.x не справлялась. Тем не менее, все называли это сборкой мусора - хотя, конечно, ты можешь назвать это как сам захочешь.

Хотя, если троллить оппонентов посредством банальной эрудиции

Нужно напоминать людям о простых вещах.

tailgunner ★★★★★
(26.12.16 13:30:23 MSK)
Последнее исправление: tailgunner 26.12.16 13:31:19 MSK (всего исправлений: 2)

Ответ на: комментарий от tailgunner 26.12.16 12:54:31 MSK

shared_ptr - тоже сборка мусора

void i_leak_mem()
{
  auto *ptr = new shared_ptr<int>(new 1);
}

Удачной «сборки мусора» бгг.

kawaii_neko ★★★★
(26.12.16 13:42:20 MSK)

Ответ на: комментарий от tailgunner 25.12.16 22:25:44 MSK

Василий, зачем ты скатил тред в срач? А ещё модератор. Не стыдно?

dependent_type
(26.12.16 13:52:25 MSK) автор топика

Ответ на: комментарий от tailgunner 26.12.16 13:30:23 MSK

Их и расставляет компилятор.

Компилятор вызывает конструкторы, деструкторы и операторы копирования-перемещения. И все. Остальное нужно ручками вписывать. Что и сделано в коде shared_ptr.

Принципиально это не отличается от двух видов ссылок в C++/CLI или даже @nogc в D.

Это разные вещи: запрет GC обрабатывать ссылки определенного вида и ручное управление памятью посредством подсчета ссылок.

Тем не менее, все называли это сборкой мусора - хотя, конечно, ты можешь назвать это как сам захочешь.

Но ведь там разработчику не приходилось писать shared_ptr<MyObject> вместо MyObject. Так что там хотя бы одно из описанных мной выше условий выполнялось. В случае с shared_ptr не выполняются оба.

Так что ты пока еще не доказал, что shared_ptr — это сборщик мусора.

eao197 ★★★★★
(26.12.16 14:01:30 MSK)

Ответ на: комментарий от dependent_type 26.12.16 13:52:25 MSK

Почему тебя это волнует? Ты отписался от топика.

tailgunner ★★★★★
(26.12.16 14:32:57 MSK)

Ссылка

Ответ на: комментарий от eao197 26.12.16 14:01:30 MSK

Компилятор вызывает конструкторы, деструкторы и операторы копирования-перемещения. И все.

Нет разницы между «компилятор вызывает функции инкремента/декремента» и «компилятор вызывает конструкторы, деструкторы и операторы копирования-перемещения, которые выполняют инкремент/декремент».

Принципиально это не отличается от двух видов ссылок в C++/CLI или даже @nogc в D.
Это разные вещи

Это одно и то же - ручное указание, где использовать GC, а где нет.

запрет GC обрабатывать ссылки определенного вида и ручное управление памятью посредством подсчета ссылок.

Ручное управление - это, например, в ядре. Там и в самом деле нужно вручную писать вызов функции, которая уменьшает/увеличивает счетчик ссылок. А с shared_ptr эти функции вызывает компилятор.

Так что ты пока еще не доказал, что shared_ptr — это сборщик мусора.

Я и не собирался это доказывать - только объяснить. Если мое объяснение тебя не убеждает - окей, оставайся при своем мнении.

tailgunner ★★★★★
(26.12.16 14:46:39 MSK)
Последнее исправление: tailgunner 26.12.16 14:48:16 MSK (всего исправлений: 2)

Ответ на: комментарий от kawaii_neko 26.12.16 13:42:20 MSK

Ахренеть, ты умеешь устраивать утечки памяти. Можно твой автограф?

tailgunner ★★★★★
(26.12.16 14:47:19 MSK)

Ссылка

Ответ на: комментарий от tailgunner 26.12.16 14:46:39 MSK

Нет разницы между «компилятор вызывает функции инкремента/декремента» и «компилятор вызывает конструкторы, деструкторы и операторы копирования-перемещения, которые выполняют инкремент/декремент».

Есть. Пусть вызывается деструктор вида:

my_smart_pointer::my_smart_pointer() {
  if(data_) {
    if(0 == dec_ref_count(data_->ref_count_)) {
      delete data_->obj_;
      delete data_;
    }
  }
}

Если я допущу ошибку и забуду декрементировать счетчик, никакого GC у меня не будет. При этом вызовы деструкторов для экземпляров my_smart_pointer компилятор будет вставлять.

Это одно и то же - ручное указание, где использовать GC, а где нет.

Это для языка с GC так можно говорить: здесь GC, здесь не GC.

В случае с C++ (в котором GC нет), этого недостаточно.

Я и не собирался это доказывать - только объяснить.

Ты не объяснил, каким образом shared_ptr относится к GC (пусть даже и на основе подсчета ссылок). То, что shared_ptr использует внутри себя подсчет ссылок еще не переводит его в категорию GC.

eao197 ★★★★★
(26.12.16 15:04:19 MSK)
Последнее исправление: eao197 26.12.16 15:11:19 MSK (всего исправлений: 1)

Ответ на: комментарий от andreyu 26.12.16 12:28:31 MSK

Плюс tcmalloc это то что его можно использовать неинтрузивно.

Т.е. вот основной юзекейс:

Написали многопоточное ПО не парясь о выделении памяти и её освобождении (в смысле используюя всё встроенное в язык/библиотеки).
Оптимизировали, что оптимизируется алгоритмически
Приделали tcmalloc - получили прирост 25% - задумались, полезли проффилировать аллокации/деаллокации, иначе - даже дёргаться не стоит в большинстве случаев

pon4ik ★★★★★
(26.12.16 15:29:42 MSK)

Ответ на: комментарий от pon4ik 26.12.16 15:29:42 MSK

tcmalloc и jemalloc были особенно актуальны, пока, начиная с какой-то версии, в стандартный glibc не впилили новый аллокатор, который стал значительно превосходить предыдущий в многопоточных приложениях. На одном довольно много-жрущем много-поточном приложении после многочисленных замеров я не заметил большой разницы между malloc из glibc, tcmalloc и jemalloc. Может быть, у кого-то по-другому

~~dave~~ ★★★★★
(26.12.16 16:04:32 MSK)

Ответ на: комментарий от eao197 26.12.16 15:04:19 MSK

Если я допущу ошибку и забуду декрементировать счетчик, никакого GC у меня не будет.

Если ты допустишь ошибку при реализации GC - естественно, у тебя не будет GC.

tailgunner ★★★★★
(26.12.16 16:45:57 MSK)

Ответ на: комментарий от tailgunner 26.12.16 16:45:57 MSK

Если ты допустишь ошибку при реализации GC - естественно, у тебя не будет GC.

Ну и где тут компилятор, который расставляет инкременты/декременты?

eao197 ★★★★★
(26.12.16 16:53:05 MSK)

Ответ на: комментарий от eao197 26.12.16 16:53:05 MSK

А. Я правильно понимаю, что ты доколебался до фразы «компилятор сам расставляет инкременты и декременты»? Имелось в виду «компилятор сам расставляет вызовы функций, реализующих GC, хотя и не знает, что они реализуют GC».

tailgunner ★★★★★
(26.12.16 17:18:19 MSK)

Ответ на: комментарий от pon4ik 26.12.16 15:29:42 MSK

иначе - даже дёргаться не стоит в большинстве случаев

Спору нет. Оптимизировать нужно те несколько процентов кода, которые дадут наибольший прирост.

andreyu ★★★★★
(26.12.16 17:21:17 MSK)

Ссылка

Ответ на: комментарий от tailgunner 26.12.16 17:18:19 MSK

Я правильно понимаю, что ты доколебался до фразы «компилятор сам расставляет инкременты и декременты»?

Это и есть ключевое в данном разговоре.

Я тебе еще раз намекаю: GC может использовать подсчет ссылок. Но это не значит, что использование подсчета ссылок приводит к появлению GC.

Так что shared_ptr в плюсах — это не GC.

eao197 ★★★★★
(26.12.16 17:31:55 MSK)

Ответ на: комментарий от eao197 26.12.16 17:31:55 MSK

Я тебе еще раз намекаю: GC может использовать подсчет ссылок. Но это не значит, что использование подсчета ссылок приводит к появлению GC.

Я этого и не утверждал (ручной подсчет ссылок в ядре - это не GC).

Так что shared_ptr в плюсах — это не GC.

Я понял твое мнение и не вижу причин соглашаться с ним.

tailgunner ★★★★★
(26.12.16 17:36:11 MSK)

Ответ на: комментарий от eao197 26.12.16 16:53:05 MSK

Ну и где тут компилятор, который расставляет инкременты/декременты?

А если ты пишешь компилятор языка с ГЦ, но допускаешь ошибку в реализации и в итоге декремента не происходит? Что у нас будет: «отсутствие ГЦ» или «наличие (, но багнутого)»?

Хотя, как по мне, разделять GC и shared_ptr удобно просто с практической точки зрения.

DarkEld3r ★★★★★
(26.12.16 17:42:31 MSK)

Ответ на: комментарий от dave 26.12.16 16:04:32 MSK

А с какой версии?

По факту у меня просто почти везде rhel6, так то, для меня пока не актуально, но это может быть одним из «за» для перехода на «что нить посвежее».

pon4ik ★★★★★
(26.12.16 17:53:07 MSK)

Ответ на: комментарий от tailgunner 26.12.16 17:36:11 MSK

Я понял твое мнение и не вижу причин соглашаться с ним.

Какого-либо обоснования своему мнению ты вообще не привел. Так что, если ты придерживаешься мнения, что shared_ptr — это GC, то подтверди это хоть чем-нибудь.

eao197 ★★★★★
(26.12.16 17:54:58 MSK)

Ответ на: комментарий от pon4ik 26.12.16 17:53:07 MSK

Уже не помню. Года полтора прошло, как последний раз работал над тем кодом. В RHEL6 вроде как должно быть уже. Вот, в RHEL5 может быть и нет

~~dave~~ ★★★★★
(26.12.16 17:59:56 MSK)

Ответ на: комментарий от DarkEld3r 26.12.16 17:42:31 MSK

Речь идет о том, что когда освобождение памяти полностью зависит от того, что и как сделал разработчик (причем как прикладном коде, так и в библиотечном), то говорить о GC можно лишь с точки зрения теории. На практике же для GC нужна помощь от компилятора. В C++ такой помощи нет, т.к. компилятор расставляет только вызовы конструкторов/деструкторов, а правильное наполнение их лежит на совести программиста.

eao197 ★★★★★
(26.12.16 18:00:52 MSK)

Ответ на: комментарий от eao197 26.12.16 17:54:58 MSK

Так что, если ты придерживаешься мнения, что shared_ptr — это GC, то подтверди это хоть чем-нибудь.

https://en.wikipedia.org/wiki/Garbage_collection_(computer_science)

«The garbage collector, or just collector, attempts to reclaim garbage, or memory occupied by objects that are no longer in use by the program.»

https://en.wikipedia.org/wiki/Garbage_collection_(computer_science)#Reference...

«Reference counting is a form of garbage collection whereby each object has a count of the number of references to it. Garbage is identified by having a reference count of zero. An object's reference count is incremented when a reference to it is created, and decremented when a reference is destroyed. When the count reaches zero, the object's memory is reclaimed.»

Какое из этих утверждений не выполняется для shared_ptr?

tailgunner ★★★★★
(26.12.16 18:06:42 MSK)

Ответ на: комментарий от eao197 26.12.16 18:00:52 MSK

т.к. компилятор расставляет только вызовы конструкторов/деструкторов, а правильное наполнение их лежит на совести программиста.

А если нужное наполнение имеется «из коробки»?

Я к тому, что не очень понимаю, где проходит грань - всё-таки компилятор тоже пишут программисты и на их совести многое находится. Опять же, (какой-нибудь) язык может не иметь GC из коробки, но иметь все средства для нормальной реализации такового в виде библиотеки. Будет ли это GC, учитывая, что в библиотеке могут быть баги?

DarkEld3r ★★★★★
(26.12.16 18:06:48 MSK)

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 →

←	Не получается отправить письмо

Development

вопрос о перенаправлении типа «<».

→

Похожие темы