LINUX.ORG.RU

Производительность вебсайта, связь чисел тестирования и IRL


0

1

Вебмастеры (условно) меряют производительность сайта в разных «униках в день» / «хостах в день» (при условии «чтобы нетормозило» и прочим эвристикам). От того что именно так им считают разные анализаторы логов. Программистам явно эти числа неудобны, им удобнее запросы в минуту-секунду, время отклика и тп. В результате получаются две разные предметные области где оперируют разными наборами чисел.

Понятно что паттерны запросов разные для разных сайтов, но для одного сайта между числами «от программистов» и числами «от вебмастеров» есть связь.

Соответственно вопросы.

а) какая приблизительно связь между между 1000 хомячков день и X конкурентными хомячками в минуту по данным например siege (c -d 1 ).

б) какие есть программы и/или методы тестирования позволяющие с одной стороны получить близкие результаты к IRL ситуации а с другой не ваять тонны тестов.

в) какие примерно параметры задавать известным утилитам тестирования что бы получить результаты близкие к IRL. Понятно что в идеале нужно снимать паттерны использования с тех же логов, переписывать в виду тест-кейсов и тп. Но тем не менее.

Интересует все - личный опыт, слухи, методы работы, числа полученные из ваших проектов и тп. Если есть какая литература, ссылки и тп - кидайте сюда.

★★☆
Ответ на: комментарий от boombick

Я был на этом сайте. Там статьи по теме методов ускорения, а не по той теме что я поднял.

kernel ★★☆
() автор топика
Ответ на: комментарий от kernel

для простых случаев есть ab и компания, для сложных как сам написал нужны сложные кейсы, всякие селениумы с макросами в браузерах

trashymichael ★★★
()
Ответ на: комментарий от trashymichael

То есть как я понимаю ничего среднего нету. Нет тестера который бы просто эмулировал хождение по линкам в случайном порядке (как условный человек), выкачивая жабаскрипиты и прочие картинки ? С поддержкой логина?

kernel ★★☆
() автор топика
Ответ на: комментарий от kernel

думаю человек — сильно отличалсябы от этого синтетического гипотетического теста :-)

* один чел зайдёт на сайт, промотает вниз и сразу закроет

* второй человек откроет несколько страниц, и закроет сайт

* третий человек проторчит на сайте весь день... :-)

....и по какой модели вычислить распределение вероятности y=f(x) [где «y» это количество кликов на сайте, а «x» это взятый случайный человек] ?? это ещё и от сайта зависит, и от методов его раскрутки [релевантности контента относительно рекламы]

выходит что всё индевидуально — для каждого сайта

user_id_68054 ★★★★★
()
Ответ на: комментарий от user_id_68054

Вообше говоря эта статистика где то есть. Более того - выцепить ее из логов гораздо проще чем заморачиватся тест-кейсами. Это раз.

Два - можно иметь чтото вроде опции «интерполировать сплайном эти числа». В смысле есть график количество народу / плотность кликов.

Но скорее всего там вообще обычная какая нибудь функция распределения - гауссиана(?) (забыл уже весь матан :D)




kernel ★★☆
() автор топика
Ответ на: комментарий от kernel

> Но скорее всего там вообще обычная какая нибудь функция распределения - гауссиана(?) (забыл уже весь матан :D)

да, я тож удмаю что функция распределения — обычная гаусовская

своим сообщениям я просто хотел сказать что для каждого сайта думаю будет — индивидуальная дисперсия (σ²) для этой гаусовской функции :-)

впринцепе зная дисперсию (или _предпологая_ дисперсию) в той функции распределения — наверно както недолго-думая — можно составить оценочную формулу зависимости количества_запросов_в_секунду от количества_посещений_в_день

а с другой стороны — вдруг дисперсия — зависит-очень-сильно от популярности сайта... тогда вся формула к чёрту :-)

# p.s.: интереный конешно вопрос, по поводу этой зависимости... надо нарыть реальных данных и исследовать

user_id_68054 ★★★★★
()
Ответ на: комментарий от user_id_68054

а с другой стороны — вдруг дисперсия — зависит-очень-сильно от

популярности сайта... тогда вся формула к чёрту :-)

Если там гауссиана, то у гауссианы всего ничего параметров. Никто не мешает их задавать перед тестированием. Подозреваю также, что трех «популярных» случаев хватит за глаза - сценарии 1 - 3 с пояснением в манах.
Да и вообще если чуть развить тему то набор сценариев с пояснениями - для какого сайта характерен такой паттерн решит многие проблемы.

Тем не менее количество посещений в секунду нужно делать не глобально, а для каждого юзера. Для того чтобы более-менее реалистично подходить, нужно чтобы робот использовал куки и ходил именно с линка на линк как живой хомячок. Ну и должна быть возможность указывать простым методом способ залогинится, что бы была возможность в том же профайле указывать что некоторые юзеры ходят залогинеными.

Грубо говоря это проект не на тему «суперкорректности» а на тему приблизительной но реалистичной оценки «сразу из коробки».

# p.s.: интереный конешно вопрос, по поводу этой зависимости... надо

нарыть реальных данных и исследовать


Я так примерно и подумал что должны быть какие нибудь известные данные, но поверхностное гугление ничего не дало. Вот решил спросить ЛОР. :) Оказалось - хренушки. Может в девелопменте надо спросить? А то больно уж этот раздел (где мы сейчас) малопосещаемый. Флеймов мало, опять же, характерный признак :)

kernel ★★☆
() автор топика

Вебмастеры (условно) меряют производительность сайта в разных «униках в день» / «хостах в день»

Это не производительность, &^%, это посещаемость - visitors per time. С производительностью - requests per time - это соотносится примерно так же, как помидор с телевизором или сладкий с синим.

какая приблизительно связь между между 1000 хомячков день и X конкурентными хомячками в минуту

Прямая. А еще прямая связь между конкурентными хомячками в минуту и количеством запросов в среднем от одного хомячка. То есть «количество запросов в минуту» прямо зависит от количества хомячков и количества запросов от каждого хомячка

no-dashi ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.