LINUX.ORG.RU

Порча данных на ФС ext3 на ядрах => 2.6.5


0

0

На LKML ведётся активное обсуждение серьёзной проблемы порчи данных, которую сначала относили к багам в приложении rTorrent, но затем оказалось, что это не так. Ошибка не затрагивает ФС ext2, а также всё работает корректно при включении опции монтирования data=writeback для ext3. Расследование продолжается.

>>> Подробности

★★★★★

Проверено: Pi ()

Значит мне это не померещилось... етиихумать... два раза уже фс слетала вместе с данными.

Deleted
()

Я не понял, что такое VM в данном контексте? И что делает опция writeback?

Xellos ★★★★★
()

У коллеги как-то на рейзере access time у файлов неправильно копировался.

anonymous
()

Уть епте, вот недаром на новый рейд засадил xfs, а все остальное с рейзера перетащил на jfs. Как жопой чуял.

Gharik
()

У меня недавно слетела на ровном месте. Вечером нормально выключил комп, утром включил - и все...
Не монтируется, не фсчекается, хотя tune2fs -l /dev/hda4 показывает инфу. Ядро 2.6.16, гентовское.

anonymous
()
Ответ на: комментарий от anonymous

Хм... Не знаю имеет ли моя проблема какое-нибудь отношение к данному трэду но вот уже 2 раз начинает лететь сабжевая ФС...

Симптомы таковы: компьютер начинает намертво виснуть. После ребута какое-то время снова работает.

Дело дошло до того, что при очередной загрузке fsck удалила журнал ext3, тем самым сделав из нее ext2. В fstab изменил ext3 на ext2 и нормально смонтировал раздел. Создал журнал, изменил fstab. Работает.

Но теперь снова система начинает падать с ошибками файловой системы, но уже на другом партишене!

Может это винчестер?

Ian ★★
()

А у меня вчера волшебным образом вылечилась. До этого чек проходил почти до конца, и в конце говорил, что обнаружены БОЛЬШИЕ файлы, но "суперблок на них не настроен". И настоятельно рекомендовал проверить ручками, а пока предлагал обойтись ^D. Пока я качал кноппикс - вчера чек прошёл нормально. Я не поверил, запустил кноппикс, проверил оттуда - всё в порядке. Что за фигня была...

Xellos ★★★★★
()
Ответ на: комментарий от Ian

ну вот и жертвы линуха получили возможность высказаться, ага :)

anonymous
()

а как воспроизвести проблему?

юзаю ext3 уже хз сколько лет на домашней машинке - ниразу не слетало ничего. в отличие от.

isden ★★★★★
()

У меня всё отлично. Что я делаю не так?

Quasar ★★★★★
()

Блин! Только перешёд с SuSE+riserfs на Ubuntu+ext3(которая связка показала себя неожиданно лучше по скоростным характеристикам) как такое западло...

LestorN
()

Какой ужас! У меня всё на ехт3! При штатной проверке, кстати, долго висит на 31% при проверке 50-гигового раздела.. может это оно? О_о

slackerr
()
Ответ на: комментарий от Ian

> Может это винчестер?

man badblocks (-w)

> У меня недавно слетела на ровном месте.

проприетари кернел модулез грузил ? тогда пеняй на себя.

szh ★★★★
()

>Расследование продолжается.

хехе, детективы блин=)

soko1 ★★★★★
()

UFS2 - архаичное дерьмо, но я ей доверяю. В линупсе всегда ощущалось чувство беспокойства. Оказывается, что не зря?

P.S. Тише едешь - дальше будешь. Надёжность важнее скорости в синтетических тестах.

anonymous
()
Ответ на: комментарий от szh

Неужели у меня версия ядра глючное, что Ext3 не слетает? :)

На 2.6.8 и 2.6.15.6 Ext3 живёт отлично. Этот баг с жизнью Ext3 исправят? :)

Quasar ★★★★★
()
Ответ на: комментарий от Zulu

В мане написано, что data=ordered по default. Сто лет юзаю её на ноуте, никакие севшие батарейки нипочем. Пробовал рейзер - переплевался, вернулся на родину. Нареканий нет.

shahid ★★★★★
()
Ответ на: комментарий от anonymous

>UFS2 - архаичное дерьмо, но я ей доверяю.

Дядя, ext2 тебе в руки.

anonymous
()

Вероятность того, что эта проблема затрагивает обычных пользователей где-то между нулем и ничем. _Слишком_ много событий должно выполниться для того, что бы это произошло.

Если вы на своей машине наблюдаете странные проблемы с ext3, то всего быстрей вам это кажется.

Но наличие такой ошибки конечно неприятно.

rtc ★★
()

Как сделать так, чтобы большие файлы удалялись быстрее, а то по пол минуты ждать приходиться. Раньше на openSUSE10 всё удалялось быстро, а сейчас Mandriva 2007 - работает намного быстрее, но парит мозгх кодировками и долгим удалением:( ext3

shahid ★★★★★
()

Ошибка все же получается на стыке VM и fs. А не в самой ext3.

Valmont ★★★
()
Ответ на: комментарий от Xellos

> but I don't have a simple solution, much less a patch

"Who the hell am I kidding? I haven't been able to sleep right for the last few days over this bug. It was really getting to me." 8)

Вроде Линус уже сделал патч, и он даже работает.

tailgunner ★★★★★
()
Ответ на: комментарий от syslik

В тему. Позавчера наблюдал ситуацию у себя на 2.6.17.6. Винт месяц назад был отформатирован под ext3. После чего монтировался, но не пользовался. Вчера попытался записать на него пару фильмов - на первом же файле выдало ошибку .... Detected aborted journal .... Remounting filesystem read-only Делаю umount, запускаю fsck.ext3. Находит ошибки и исправляет их. Запускаю проверку ещё раз - fs clean. Ок. mount. Пытаюсь повторно записать на диск файлы. Опять облом - та же ошибка!.. Ругаюсь матом, umount, mkfs.ext3, mount... Всё ок... Что было - не понятно. Винт 100% рабочий.

anonymous
()
Ответ на: BUG FOUND от szh

Достаточно добавить в fstab опцию data=writeback, чтобы, так сказать, предохраниться? Какие последствия могут быть? И не мог бы кто-нибудь толком несведущему объяснить, что этот параметр обозначает?

Bohtvaroh ★★★★
()
Ответ на: комментарий от propheta

Специально обученные люди из компании Novell, подкупленные Microsoft под видом честных строителей Open Source послали деструктивные патчи... За то что делаешь отвечать нужно, и код писать не на .Net а потом портировать. А то всюду у вас «редмоновский» след. ---------------- Аноним усы всех стран объединяйтесь...

anonymous
()

Похоже, это всё объясняет необъяснимые до этого порчи дэйтаблоков на больших БД Oracle в CentOS на SMP... Странно что этот баг так поздно заметили и нашли причину. Видимо, все уже привыкли к мысли, что Linux должен работать как часы. Линусу 5 за упорство и настойчивость.

asaw ★★★★★
()
Ответ на: комментарий от rtc

> Вероятность того, что эта проблема затрагивает обычных пользователей
> где-то между нулем и ничем. _Слишком_ много событий должно выполниться
> для того, что бы это произошло.
Ага, ещё даже Линус не знает, что это за события и много ли их, а
ты уже конечно знаешь.
Хоть бы по ссцылке сходил для прикола. Написано там, что на клиенте
rtorrent это стабильно наблюдается, а так же там есть тестовая прога,
которая глюк воспроизводит.
Все, кто здесь утверждает, что у них ext3 не глючит - просто запустите
тестовую прогу, доступную по ссылке, и посмотрите.

anonymous
()
Ответ на: комментарий от Bohtvaroh

>И не мог бы кто-нибудь толком несведущему объяснить, что этот параметр обозначает?

у вас злой хакир удалил маны?

writeback

Data ordering is not preserved - data may be written into the main file system after its metadata has been committed to the journal. This is rumoured to be the highest-throughput option. It guarantees internal file system integrity, however it can allow old data to appear in files after a crash and journal recovery.

AcidumIrae ★★★★★
()
Ответ на: комментарий от rtc

> Если вы на своей машине наблюдаете странные проблемы с ext3, то всего быстрей вам это кажется.

Кстати в mc наблюдаю какую-то проблему при смене директорий (под ext3). Проявляется только на нескольких директориях и даже проверка фс ничего не решает. Вообще странно... перебегать на jfs?

los_nikos ★★★★★
()
Ответ на: комментарий от anonymous

> Ага, ещё даже Линус не знает, что это за события и много ли их, а ты уже конечно знаешь.

Это логично звучит хотя бы потому, что в противном случае достаточно много людей с этим бы столкнулись, и проблема бы всплыла намного раньше.

askh ★★★★
()
Ответ на: комментарий от askh

> Это логично звучит хотя бы потому, что в противном случае достаточно
> много людей с этим бы столкнулись, и проблема бы всплыла намного
> раньше.
Да я понимаю. Просто один напишет "проблема воспроизводится слишком
редко чтобы беспокоиться", а другой будет писать про всякие события
и строить из себя шибко умного. :)

anonymous
()
Ответ на: комментарий от los_nikos

> перебегать на jfs?

Угу. Я тут недавно перевел корень домашней системы на JFS -- посыпалась на второй день. fsck помог и больше оно ни разу не глючило. До этого на том же самом разделе без проблем работали ext3 и reiser3.6. В общем, JFS'у я бы данные не доверил, а вот с ext3 слезать никуда не собираюсь.

Relan ★★★★★
()
Ответ на: комментарий от los_nikos

Да, пишет следующее: "Внимание: невозможно перейти в <полный путь к папке>", и ни разу не встречается символ '_'.

PS: А при чём там этот символ?

los_nikos ★★★★★
()
Ответ на: комментарий от los_nikos

У меня при попытке зайти в папку где в названии есть '_' mc в hintbar пишет "невозможно сменить каталог", но всё-таки заходит, bash-3.2.009, ext3,koi8-r, c bash-3.1.xx такого нету, на других фс не проверял; думаю, может не один я такой...

frame ★★★
()
Ответ на: комментарий от Relan

У меня есть машина, на ней / и /home - JFS. Живёт уже неделю, пока жива.

Xellos ★★★★★
()
Ответ на: комментарий от iron

Да нифига! Назовите мне файловую систему, с проблемами на которой НИКТО не сталкивался? Про полёты рейзера на лоре не раз говорили. Теперь и ext3 и jfs не панацея.

NTFS? :-)

Xellos ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.