организации данных на основе первичных данных статистических
источников (на микроуровне) представляет собой обычную таблицу
«объекты – признаки». Структура на макроуровне (на основе
агрегированных данных) – это сложные многомерные группировки по
иерархическому принципу или принципу таблиц сопряженности на основе
некоторых критериев (тематических, пространственных или
хронологических).
Формулярные источники, совсем недавно получившие название
структурированных (highly structured historical sources), изначально имеют
четкую структуру (формуляр), что делает их наиболее удобными для
перевода в машиночитаемый вид. К структурированным источникам
относятся материалы переписей, книг церковной или гражданской
регистрации рождения, крещения, брака и смерти, личные дела и личные
карточки, анкеты, справочники. Основными особенностями этих
источников являются отсутствие агрегированной информации и
соединение разнотипной информации (текстовой, числовой, логической) в
одном формуляре. Формуляр источника часто представляет собой
практически готовую структуру базы данных (надо только описать
атрибуты объектов).
Текстовые (нарративные) источники являются наиболее трудными для
формализации и перевода в машиночитаемую форму. Основная
особенность этих источников - отражение в них структуры естественного
языка. Хотя в тексте может присутствовать и формальная структура
(разделы, параграфы, абзацы и т.п.), степень формализации текстовых
источников невысока. Текст можно хранить в полном виде как линейную
последовательность символов или в формализованном виде (с некоторой
потерей информации), в последнем случае необходимо внести в текст
специальные коды, поместить в нем нужные смысловые единицы.
Наконец, в последнее время создаются базы данных, содержащие,
наряду с описательной, графическую информацию. Графическую
информацию в исторических исследованиях представляют
изобразительные источники, фотодокументы, географические карты и др.
Однако и обычные тексты (особенно это касается средневековых текстов)
могут быть представлены в виде графических изображений, если их
вводить с помощью устройства оптического ввода – сканера.
Итак, при построении баз данных необходимо учитывать особенности
структуры исторических источников, на основе которых они создаются.
При этом исследователь, имеющий дело с менее структурированным
источником, может не только вводить в память компьютера полный его
текст, но и формировать некоторые структуры, внешние по отношению к