LINUX.ORG.RU
ФорумTalks

Треш с ext4

 


0

2

Не флейма ради...

Настраивал всю ночь новый сервак с совершенно новым железом. Завёл java, jira в связке с PostgreSQL, git/merkurial с scm-manager, LAMP...и тут смотрю - почему-то слетела jira. Полез копать дальше - не отвечает postgres. Перезапускаю - не перезапускается. Лезу в логи - там ничего. Только через пару минут обнаружил что ФС перевелась в режим RO. Предупредил заказчика что мол такая фигня, надо ребутнуть и после перезагрузки есть вероятность что нифига не заведётся. Прочекал, ребутнулся - ssh конечно же отвалился. Утром комп выключили/включили - та же песня. Пришёл чел, прошёлся fsck'ом - всё завелось. Загружаюсь - в /var почти ничего нет (вся система стояла на /), в том числе и базы jira.

ФС - Ext4. Выводы делайте сами.

★★★★★
Ответ на: комментарий от zgen

И кто-нибудь мне объяснит, как ВНЕЗАПНО fs (скайнет на связи?) посереди процесса, без перезапуска, сама перевелась в RO?

I/O error иногда к такому приводит. А иногда к панику.

drBatty ★★
()
Ответ на: комментарий от soko1

Глупости. Во-первых всё завелось и уже работало утром, во-вторых, расскажи мне какими-такими действиями можно убить ФС?

многими. Даже кривая RAM может. А уж команды…

drBatty ★★
()
Ответ на: комментарий от Reset

reiserfs у меня разваливалась, поэтому твое утверждение про «живучей» не верно, про скорость тоже сомнительно

ППКС

drBatty ★★
()
Ответ на: комментарий от soko1

Почитай форумы, если проблемы есть, то они чаще всего в убунте. Конечно на это влияет ещё и попсовость дистрибутива, но что это платформа для всякого рода экспериментов над пользователями - факт.

это хорошо характеризует пользователей.

drBatty ★★
()
Ответ на: комментарий от soko1

Я не видел вывода fsck

ССЗБ

Вот именно, даже FAT&NTFS

EXT тем более.

Возможно железо (про это я кстати упомянул), но мои руки тут ни разу не при чём.

Я не видел вывода fsck

ну-ну.

drBatty ★★
()

Любая фс посыпаться может.
Если нет бэкапов — ССЗБ

xorik ★★★★★
()
Ответ на: комментарий от mv

стоит на самом разном железе. Впечатление самой пуленепробиваемой системы

Аналогично.

redgremlin ★★★★★
()
Ответ на: комментарий от drBatty

читай их рассылку. Точнее архив, может что-то изменилось.

Как обычно, голову в песок. Даже в linux-fsdevel поток писем приличный. Мне что, всё перерыть, только чтобы найти подтверждение твоим словам? Не ты ли должен это делать?

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

Как обычно, голову в песок. Даже в linux-fsdevel поток писем приличный. Мне что, всё перерыть, только чтобы найти подтверждение твоим словам? Не ты ли должен это делать?

я должен. Если-бы я что-то доказывал. В данном случае - раньше так было, а сейчас как - я не знаю. Речь про _разработку_ EXT4 была, это уже история. Копаться в истории мне лень(я не понимаю, зачем? Тебе это важно? Вот ты и копайся).

Где-то когда-то я приводил прруфлинки на рассылку деба, в которой описывались новые фичи EXT3/4, когда ещё ext4 была сырой и кривой(2005й, ЕМНИП). Может это даже ещё была ext3devel, а не ext4. Не помню.

drBatty ★★
()

Запусти memtest86+ хотя бы на ночь.

Deleted
()
Ответ на: комментарий от drBatty

В данном случае - раньше так было, а сейчас как - я не знаю.

Если тебе так кажется, скажи, что тебе кажется. Но не обставляй так, словно это истина и ты можешь её доказать.

Где-то когда-то я приводил прруфлинки

Другие люди, они... другие. Они могут знать что-то, что не знаешь ты, и не знать что-то, что знаешь ты. Тот факт, что ты приводил «пруфлинки» не тождественен факту предоставления «пруфлинка» сейчас.

я не понимаю, зачем?

Чтобы не прослыть пустословом.

i-rinat ★★★★★
()
Ответ на: комментарий от drBatty

I/O error иногда к такому приводит. А иногда к панику.

Первый раз за очень много лет слышу о RO при IO error.

zgen ★★★★★
()
Ответ на: комментарий от darkenshvein

Или БП просаженый
Или материнка на корпус коротит :)

Jetty ★★★★★
()
Ответ на: комментарий от i-rinat

Если тебе так кажется, скажи, что тебе кажется. Но не обставляй так, словно это истина и ты можешь её доказать.

могу и доказать, но сам понимаешь - копать надо.

Другие люди, они... другие. Они могут знать что-то, что не знаешь ты, и не знать что-то, что знаешь ты. Тот факт, что ты приводил «пруфлинки» не тождественен факту предоставления «пруфлинка» сейчас.

я не понимаю, это для тебя дело принципа?

Чтобы не прослыть пустословом.

т.е. ты желаешь доказать, что я ошибаюсь? Ну докажи, я и не спорю - могу ошибиться. Я ваще-то не Бох, если ты забыл. И даже не Патрег. А мне искать пруфы - лень, в чём я и расписался. Если это так ВАЖНО, создай тему, и в ней обоснуй ЗНАЧИМОСТЬ данной проблемы. Я пошукаю.

drBatty ★★
()
Ответ на: комментарий от oxumorron

«testing» это такой деб, в котором (в т.ч.) и рассказано про статус. А статус:

Ext4 in Squeeze, testing and Unstable

Upstream kernels since 2.6.28 (which has a serious resize bug) officially supports Ext4 in production environments.
Ext4 is currently in Debian Installer. 

перевод нужен?

DebianSqueeze (Debian 6.0.7) is the current stable release of Debian, and has been since 2013-02-23.

и именно про него и говорит твоя цитата.

ЗЫЖ вроде всё просто?

drBatty ★★
()
Ответ на: комментарий от zgen

Первый раз за очень много лет слышу о RO при IO error.

ну…

я уже недавно цитировал:

       errors={continue|remount-ro|panic}
              Define  the  behaviour when an error is encountered.  (Either ignore errors and just mark the filesystem erroneous
              and continue, or remount the filesystem read-only, or panic and halt the system.)   The  default  is  set  in  the
              filesystem superblock, and can be changed using tune2fs(8).

в данном случае «errors» на практике часто именно I/O. А вот была или нет перезагрузка - нам не известно. Т.е. возможно посыпались ошибки, перезагрузилось, и RO. На битых дисках я видел такое.

drBatty ★★
()
Ответ на: комментарий от megabaks

так давно известно, что ext4 сырая и пока что не годится
не слушает же никто...

Скажи это моим серверам на ней.

tazhate ★★★★★
()
Ответ на: комментарий от soko1

Мне просто ssh дали. Я бы убунту никогда б на сервак не поставил, даже LTS. Ну и ext4 туда же.

Ясно все с тобой.

tazhate ★★★★★
()
Ответ на: комментарий от drBatty

О как! Был абсолютно уверен, что это собственно сам статус, а не перечисление веток. Спасибо!

oxumorron
()
Ответ на: комментарий от soko1

Но железо новое совсем.

Аргумент, конечно, зашкаливает...

Deleted
()
Ответ на: комментарий от Reset

reiserfs у меня разваливалась, поэтому твое утверждение про «живучей» не верно

у меня

Ещё один «аргумент»

Deleted
()
Ответ на: комментарий от Deleted

Все встреченные мной баги были подтверждены и соответствующие исправления, судя по ченджлогам, появились в подних 2.4, но с тех пор я на reiser ни ногой.

Reset ★★★★★
()
Ответ на: комментарий от megabaks

скорость - есть цифры

где? только не от тебя, а от независимых исследователей

живучесть - ман notail, виндузятник

какое отношение это имеет к живучести, линуксятник?

Reset ★★★★★
()
Ответ на: комментарий от Reset

ты решил меня прокатить за балабола? о_О
а отношение...самое прямое
подумай почему сам - мне надоело каждому неучу разжёвывать

megabaks ★★★★
()
Ответ на: комментарий от aidaho

Иногда я жалею, что посты нельзя плюсовать! ППКС.

unanimous ★★★★★
()
Ответ на: комментарий от megabaks

живучесть - ман notail

Читал man, не нашёл про живучесть. Гуглил, не нашёл связи между хвостами и ошибками, кроме сообщений 13-летней давности. (Я под словом живучесть понимаю устойчивость к разрушению структуры ФС (без учёта специально внесённых разрушений)

Меня это немного беспокоит, так как в порядке эксперимента я включил маленькие хвосты. Пока полёт нормальный.

i-rinat ★★★★★
()
Последнее исправление: i-rinat (всего исправлений: 1)
Ответ на: комментарий от i-rinat

дык...не всё тайное явно
я пока не видел развалов фс без упаковки хвостов
а живучесть...
недавно что-то компелялось где-то фоном
отрубили свет
включаю - проверка пошла
по среди проверки опять отрубают свет (новый район - новостройки, джумшуты и иже с ними...)
восстановление прошло успешно
простых однократных отключений фс пережила...у всех домашних столько пальцев нет

megabaks ★★★★
()
Последнее исправление: megabaks (всего исправлений: 1)
Ответ на: комментарий от Cancellor

Только ReiserFS, только стабильность!

Не флейма ради, но забавно. Когда я четыре года назад (как время летит-то) тестировал ext4, при чём на агрессивных тестах, с фрагментацией и параллельным чтением, она показала себя заметно быстрее, чем reisrefs. На одном уровне с reiser4.

Прошли годы, и... Тесты я прогнать в прежних объёмах ленюсь, но на практике. Вот загрузка машины до и после (week 6) перевода кеша превьюшек картинок и аттачей с ext4 на reisrefs:

http://www.balancer.ru/img/forums/1302/munin-cpu-month-02.png

А вот тут — нагляднее. Время отработки munin-update:

http://www.balancer.ru/img/forums/1302/munin-update-month-02.png

Неплохо, да? :) Система страшно тупила на работе с кешами (тормоза при заходе в каталоги, очень долгий find -mtime и т.п.), хотя когда-то не тормозила на куда более слабом железе на reisrefs. Ну и я решил тряхнуть стариной. А оно вон как оказалось :)

KRoN73 ★★★★★
()
Ответ на: комментарий от megabaks

В упор не вижу, почему хвосты - плохо для живучести. Все метаданные журналируются, а тут ещё и некоторые данные тоже.

i-rinat ★★★★★
()
Ответ на: комментарий от KRoN73

Сдаётся мне, что это из-за фрагментации директорий. У ext4 они никогда не уменьшаются; и e4defrag их не берёт. Может их надо было сначала раздуть пустыми файлами, на пустом разделе?

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

ты же курил код - вот ты мне и ответь:
почему с упакованными хвостами фс сыпятся, а без живут и не парятся?
почему с упаковкой хвостов скорость падает со временем, а без нет? неужто банальная фрагментация?

megabaks ★★★★
()
Ответ на: комментарий от megabaks

я его только пытался курить, ядро вообще сложное, а стиль кода у райзера не способствует пониманию.

Касательно осыпания — у меня ни разу не было, ни с хвостами, ни без. А вот деградацию скорости я в первый раз словил с notail. Так что notail это не панацея.

Вообще можно за уши притянуть такую гипотезу: с хвостами метаданных становится больше, иногда в разы. Больше метаданных — больше фрагментации, больше шансов словить баг железа.

i-rinat ★★★★★
()
Ответ на: комментарий от i-rinat

не только железа, но и самой фс
судя по «историям успеха»

megabaks ★★★★
()

ext4 сейчас самая распространенная фс на новом железе ubuntu server - тоже в топах распространенности.

пару дней назад видел такую же ошибку на   centos5 + ext3.

Что делать выводы что ext3 слишком сырая и ставить стабильную gentoo?

Или всё-таки верить dmesg в котором написано что был таймаут на запись сектора?

ihanick
()
Ответ на: комментарий от i-rinat

просто давно пора понять, что упаковка хвостов( и сама фс, естессно) делалась во времена дорогих накопителей, а значит маленьких винтов - сейчас под рута резервируют столько же, сколько экономят упакованные хвосты

megabaks ★★★★
()
Ответ на: комментарий от i-rinat

Может их надо было сначала раздуть пустыми файлами, на пустом разделе?

Это происходит в первые минуты после запуска системы кеширования :) Там вложенность каталогов /ab/cd/, где символы — первые 2+2 символов от md5. Так что 256*256 каталогов создаются почти сразу.

И прикол в том, что система работает много лет. А вот тормозить стала где-то в последний год. Хотя ни объём кеша, ни нагрузка особенно не нарастали.

KRoN73 ★★★★★
()
Ответ на: комментарий от punya

Нет, на menuetos, блин.

Естественно, на линухе, я его использовал еще в те времена когда ты пешком под стол ходил.

Reset ★★★★★
()
Ответ на: комментарий от KRoN73

Я в начале прошлого года тестировал на таком use-case. ext3,4, reiserfs,4, xfs, btrfs, zfs. Только две файловые системы не деградируют. Это btrfs и zfs. Остальное все деградирует страшно, причем всё упирается в обновление журнала.

Reset ★★★★★
()
Последнее исправление: Reset (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.