
Глава
13.
Перспективы
исследований,
связанных
с
кэшированием
479
агентом пользователя данные перемещаются ближе к пользователю, но при
этом потребляется больше сетевых ресурсов, включая пользовательское со-
единение с Internet. Если агент пользователя осуществляет взаимодействие
через прокси-сервер, ответ сервера может кэшироваться на прокси-сервере.
В качестве альтернативы прокси-^сервер может сам выполнять упреждающую
выборку ресурсов. Это снижает нагрузку на каналы между прокси-сервером и
агентом пользователя ценой внесения дополнительной задержки для агента
пользователя, связанной с извлечением данных с прокси-сервера.
Одной из первых систем выборки с упреждением в HTTP, осуществляющих
синтаксический анализ HTML-файлов и упреждающую выборку ресурсов на осно-
ве гиперссылок, была система Letizia [Lie95], о которой говорилось в главе 2 (раз-
дел 2.8.2). В Letizia для отображения загруженного с упреждением содержания от-
крывались дополнительные окна. Система допускала настройку, чтобы следовать
гиперссылкам в этих документах с целью упреждающей выборки ресурсов, на ко-
торые указывают гиперссылки. Однако упреждающая выборка всех ресурсов, на
которые указывают гиперссылки на странице, может обусловить слишком боль-
шую нагрузку. Применяя эвристическую процедуру, клиент может с упреждением
выбрать первые несколько ссылок на странице в предположении, что они являются
наиболее популярными. Возьмем Web-страницу, содержащую список URL, возвра-
щенный поисковой системой. Пользователь, скорее всего, будет обращаться к эле-
ментам списка по порядку, поскольку поисковая система уже выполнила их ран-
жирование. Однако в некоторых случаях популярность URL может быть не связа-
на с их расположением на странице.
Агент пользователя может оценить популярность URL на основе предыдущих
запросов. Например, Letizia отслеживает предпочтения пользователя и действия
при просмотре страниц с целью определения, какие ресурсы выбрать с упреждени-
ем.
В сравнении с агентами пользователя, прокси-сервер лучше может судить о по-
пулярности ресурсов, анализируя запросы групп клиентов. На основе анализа по-
ведения пользователей прокси-сервер может определить, какие гипертекстовые
ссылки наиболее популярны. При получении запроса на HTML-файл прокси-сер-
вер может также осуществить упреждающую выборку популярных ресурсов, дос-
тупных на Web-странице. Однако прокси-сервер не будет иметь достаточно дан-
ных о поведении пользователей, если только несколько клиентов не обратились
в прошлом к HTML-файлу [JK98]. Сервер обладает более полной информацией о
поведении пользователей. Таким образом сервер может предоставить прокси-сер-
веру рекомендации относительно того, какие ресурсы вероятнее всего будут запро-
шены в будущем, о чем говорилось ранее в разделе 13.2.
Вместо того чтобы отправлять прокси-серверу рекомендации, можно встраивать
статистические данные о популярности ресзфсов в HTML-файл. Например, гипертек-
стовая ссылка может содержать дополнительную информацию о вероятности того, что
пользователь выберет эту ссылку после чтения содержимого страницы. Это требует
изменения HTML-страницы и периодического обновления статистики для страницы.
Подобные подходы наиболее эффективны для специфических приложений, таких как
поисковые машины, но не для всех HTML-страниц. В некоторых случаях человек,
создавший HTML-файл, может напрямую управлять упреждающей выборкой. Напри-
мер,
предположим, что в HTML-файле http://www.foo.com/index.html имеется ги-
пертекстовая ссылка на HTML-файл http://www.foo.com/neat.html, содержащий
встроенное изображение http://www.foo.com/pic.jpg. Наличие гиперссылки на
pic.jpg на странице index.html приводит к тому, что клиент заранее выберет изобра-
жение при загрузке начальной Web-страницы. В результате изображение уже будет