История изменений
Исправление intelfx, (текущая версия) :
Действительно ли при использовании ZFS или BTRFS все одинаковые копии файлов будут указывать на один и тот же файл на диске?
Нет, не все — что хеш-таблица поймает. Но обычно большинство. А ещё дедупликация в реальном времени жрёт крайне много ресурсов, поэтому стоит подумать, так ли тебе это надо, или тупой rmlint
ночью по расписанию будет лучше.
Если да, то какая из ФС лучше подходит для такой задачи?
У ZFS есть in-band deduplication (т. е. дедупликация будет происходить непосредственно в момент записи) и она встроенная, у btrfs нужно использовать сторонние инструменты (типа bees) и они out-of-band, т. е. дедупликация будет «догонять» записи в своём темпе. Что из этого тебе больше подходит — решай сам.
Исправление intelfx, :
Действительно ли при использовании ZFS или BTRFS все одинаковые копии файлов будут указывать на один и тот же файл на диске?
Нет, не все — что хеш-таблица поймает. Но обычно большинство. А ещё дедупликация в реальном времени жрёт крайне много ресурсов, поэтому стоит подумать, так ли тебе это надо, или тупой rmlint
в режиме рефлинков ночью по расписанию будет лучше.
Если да, то какая из ФС лучше подходит для такой задачи?
У ZFS есть in-band deduplication (т. е. дедупликация будет происходить непосредственно в момент записи) и она встроенная, у btrfs нужно использовать сторонние инструменты (типа bees) и они out-of-band, т. е. дедупликация будет «догонять» записи в своём темпе. Что из этого тебе больше подходит — решай сам.
Исправление intelfx, :
Действительно ли при использовании ZFS или BTRFS все одинаковые копии файлов будут указывать на один и тот же файл на диске?
Нет, не все — что хеш-таблица поймает. Но обычно большинство. А ещё дедупликация в реальном времени жрёт крайне много ресурсов, поэтому стоит подумать, так ли тебе это надо, или тупой rmlint
в режиме рефлинков ночью по расписанию будет лучше.
Если да, то какая из ФС лучше подходит для такой задачи?
У ZFS есть in-band deduplication (т. е. дедупликация будет происходить непосредственно в момент записи) и она встроенная, у btrfs нужно использовать сторонние инструменты (типа bees) и они out-of-band, т. е. дедупликация будет «догонять» записи в своём темпе.
Исходная версия intelfx, :
Действительно ли при использовании ZFS или BTRFS все одинаковые копии файлов будут указывать на один и тот же файл на диске?
Нет, не все — что хеш-таблица поймает. Но обычно большинство. А ещё дедупликация в реальном времени жрёт крайне много ресурсов, поэтому стоит подумать, так ли тебе это надо, или тупой rmlint
ночью по расписанию будет лучше.
Если да, то какая из ФС лучше подходит для такой задачи?
У ZFS есть in-band deduplication (т. е. дедупликация будет происходить непосредственно в момент записи) и она встроенная, у btrfs нужно использовать сторонние инструменты (типа bees) и они out-of-band, т. е. дедупликация будет «догонять» записи в своём темпе.