
Глава 10. Описание параметров рабочей нагрузки 357
мыми друг от друга. Например, время между двумя гипертекстовыми переходами
пользователя зависит от размера ответа па запрос. Дальнейшее изучение может
обеспечить более детальное понимание зависимостей между параметрами. После
краткого введения в статистику и в распределения вероятностей будет изложено
текущее понимание характеристик нагрузки Web.
10.2.
Статистики и распределения вероятностей
Описание рабочей нагрузки включает связывание каждого параметра модели
рабочей нагрузки с колР1чествеп1Пз1ми значениями, полученными на основе анализа
результатов измерений. Хотя использование простых статистик, например, средне-
го,
медианы и дисперсии достаточны для некоторых параметров нагрузки, однако
распределения вероятностей обеспечивают более общий способ выяснить, как из-
меняются параметры в некотором диапазоне значений.
10.2.1.
Среднее, медиана и дисперсия
Статистики, такие как среднее, медиана и дисперсия, описывают основные
свойства многих параметров нагрузки Web. Рассмотрим файл регистрации сервера,
в котором записывались метод запроса и код ответа для каждой Web-транзакции.
Определение доли запросов, используюгцих метод GET, или доли ответов с кодом
200 ОК включает в себя число передач каждого типа. Другие параметры, такие как
размер ответного Web-сообщения, имеют существенно более широкий диапазон
значений. Вычисление доли ответов с каждым возможным размером сообщения
было бы очень утомительным. Вместо этого, характеристики размеров ответов
можно представить некоторой статистикой, например, средним размером ответа.
Однако па практике среднее значение не охватывает всех характеристик изменчи-
вости большинства параметров Web-пагрузки.
Фактически, когда параметр изменяется в широких пределах, среднее значе1Н1е
является очень обманчивой статистикой, так как может быть искажено достаточно
малым количеством больших значений. Например, предположим, что сервер генери-
рует пять ответных сообщений с размерами 4100, 4700, 4200, 20000 и 4000 байтов,
соответственно. Осповагнюе на этих пяти ответах среднее значение равно 7400 бай-
там. Однако это значение не дает правильного представления о типичном размере
ответа. Альтернативной статистикой является медиана
—
размер «серединно! о» ре-
сурса
—
первая половина ресурсов имеет значения большие, чем медиана, а вторая
половина
—
меньшие. В этом примере медиана равна 4200 байтам, что лучию опи-
сывает типичный размер ответа. Однако медиана не указывает па возможность
того,
что размер ответа может принимать очень большое значение. Последователь-
ность 4100, 4700, 4200, 4800 и 4000 будут иметь ту же самую медиану.
Вычисление среднего и медианы улучшает картину. Факт того, что медиана
много меньше среднего, говорит о наличии относительно малого числа больших
значений. Например, первая последовательность имеет среднее значение 7400, а
медиану 4200, что как раз и свидетельствует о наличии больишх значений ответов
сервера. В противоположность этому, вторая последовательность имеет среднее
значение 4360, которое очень близко к медиане, равной 4200. Поэтому можно пред-
положить, что размеры ответов в этом случае меняются не очень сильно. Кроме
среднего и медианы имеются и другие статистики, такие как дисперсия и среднее
квадратическое отклонение, определяющие, насколько сильно параметр отклоняет-