
336
Часть
IV. Измерение и описание Web-трафика
просов и записи информации о последующих ответах, включая время и HTTP-заго-
ловки. На практике активные измерения могут проводиться с помощью упрощенно-
го клиеггга, который не поддерживает всех возможностей браузера. Этот клиент
обычно читает входной файл, содержащий список URI, которые надо запросить, и
моменты времени, когда эти запросы должны быть отправлены.
Проведение эксперимента, основывающегося на активных измерениях, требует
ответов на следующие вопросы:
• Где разместить модифицированные клиенты. Результаты активных измере-
ний очень чувствительны к расположению клиентов. Производительность у
разных пар клиент-сервер разная. Клиенты отличаются с точки зрения скоро-
сти доступа, близости к Web-серверу и наличия или отсутствия прокси-серве-
ров.
Ощущения у клиента с высокоскоростным доступом через локальную
сеть будут существенно отличаться от ощущений клиента, подключенного
к Internet с помощью низкоскоростного модема. Ощущения пользователя
в Соединенных Штатах при запросе Web-страницы с сервера в Северной Аме-
рике существенно отличаются от ощущений пользователя в России при обра-
щении к той же странице. Когда Web-сайты реплицируются на разные компь-
ютеры, два клиента не обязательно получат HTTP-ответы от одного и того же
компьютера. Один сервер, содержащий копию сайта, может быть сильно за-
гружен, а другой в то же самое время может простаивать. Поэтому произвести
активные измерения, результаты которых могли бы считаться репрезентатив-
ными, чрезвычайно сложно.
• Какие запросы создавать. Web-сайты существенно различаются по произво-
дительности. Web-серверы функционируют на различных аппаратных плат-
формах, используют различное серверное программное обеспечение, подклю-
чены к различным каналам, популярность установленных на них Web-сайтов
также существегню различается. Кроме того, две Web-страницы на одном и
том же сайте мохут отличаться по размеру, так и по числу и объему встроен-
ных в них изображений. Один подход состоит в выборе репрезентативного на-
бора запросов на основе популярности Web-страниц или Web-серверов. На-
пример, список популярных URL может быть получен из предыдущих изме-
рений трафика, например, мониторинга пакетов или протоколирования на
прокси-сервере. Тогда модифицированный клиент может воспроизводить эти
запросы, чтобы измерить качество доступа к этим страницам с точки зрения
пользователя. В качестве альтернативы можно определить, какие сайты вклю-
чить в эксперимент, по списку наиболее популярных Web-сайтов. Понятие
популярности сайтов и URL может зависеть от масштаба и места проведения
эксперимента; например, пользователи в России обращаются к другим сайтам,
нежели пользователи в Соединенных Штатах. Выбор Web-сайтов может опре-
деляться и другими критериями, например, желанием сравнить сайты, ис-
пользующие разное серверное программное обеспечение.
• Какие данные следует собирать. Вопрос о том, какие именно данные будут
собираться во время эксперимента, влияет на то, какие проблемы производи-
тельности можно при этом исследовать. Модифицированные клиенты могут
регистрировать самую разную информацию о запросах, такую как задержки,
связанные с запросами к DNS-серверам, установкой ТСР-соединений, пере-
сылкой HTTP-данных и получением ответов. Но клиенты не могут точно оп-
ределить ИСТ0Ч1ШК задержки. Например, журнал не покажет, какие действия
выполнил локальный DNS-сервер, был ли таймаут TCP обусловлен утерей
пакета, был ли HTTP-запрос удовлетворен исходным сервером или про-