
250
Частотный ранговый равнодлинный словарь
котором словники ранжированы в
порядке убывания их частот.
Частотный ранговый равнодлин-
ный словарь — словарь, в котором
словарные единицы расположены
(ранжированы) по порядку убы-
вающих частот и упорядочены по
длине словарных единиц (слов),
т.е. количеству словоформ каждой
лексической единицы.
Частотный ранговый словарь —
список всех словоформ корпуса
исследуемых текстов, в котором
все словоформы расположены в
ранжированном ряду в порядке
возрастания их порядковых номе-
ров {рангов) и в порядке убыва-
ния их абсолютной частоты.
Частотный ранговый список сло-
воформ — список, в котором все
словоформы расположены в ран-
жированном ряду в порядке воз-
растания их порядковых номеров
(рангов) и в порядке убывания их
абсолютной частоты.
Частотный словарь — 1. Конкрет-
ная вероятностно-статистическая
модель изучаемого подъязыка на
лексическом (или соответственно
любом другом) уровне. 2. Модель
истинного распределения истин-
ных вероятностей (грамматических
ожиданий, частоты слов, грамма-
тических форм и т.п.). 3. Модель,
отражающая статистические свой-
ства генеральной совокупности
(подъязыка) в плане его лекси-
ко-грамматической архитектони-
ки. 4. Модель статистической струк-
туры текста, в которой формали-
зуется (табулярно) обратная зави-
симость между рангом (порядко-
вым номером) словоформы в час-
тотном списке и ее частотой. 5. По-
следовательность словоформ, снаб-
женных рядом статистико-инфор-
мационных характеристик, све-
денных для обследования в ран-
жированные
списки.
6.
Словник
некоторой выборки из текстов, в
котором каждая словарная едини-
ца снабжена заданными инфор-
мационно-статистическими ха-
рактеристиками. 7. Представляет
собой ранжированный словник
(L) выборки (N) с заданными
параметрами из массива исследу-
емых текстов (М), в котором каж-
дая словарная единица (W) снаб-
жена полученными информаци-
онно-статистическими характери-
стиками, в частности: ранг (i), аб-
солютная частота (F), накоплен-
ная абсолютная частота (F*), от-
носительная частота (f), накоп-
ленная относительная частота
(Р),
средняя информация (I), на-
копленная информация (I*), энт-
ропия (Н), накопленная энтропия
(Н*). Иногда могут выделяться и та-
кие параметры, как количество вы-
борки (текстов), в которых встреча-
лась данная словарная единица (п),
ее абсолютная частотность по вы-
боркам (F1 — в первой выборке,
F2 — во второй и
Fn
— т.д.),
средняя частотность по выборкам,
частоты в объединенной выборке
(F), употребительность (V), рас-
пространенность (D) и т.д. 8. Час-
Членение предложения
251
тотные словари предстают в рам-
ках инженерной лингвистики в трех
аспектах: во-первых, они могут
быть получены с помощью ЭВМ,
т.е. инженерно-лингвистическим
способом; во-вторых, они могут
служить средством достижения
лингвистических целей с помо-
щью ЭВМ; в-третьих, само стати-
стико-вероятностное
моделирова-
ние лексики или иных языковых
уровней частотными словарями
является неотъемлемой частью ин-
женерно-лингвистического подхо-
да. 9. Составленная в результате
статистического анализа конкрет-
ная вероятностно-статистическая
модель изучаемого подъязыка на
лексическом (и соответственно
любом другом) уровне. 10. Модель
истинного распределения истин-
ных вероятностей (математичес-
ких ожиданий, частот слов, грам-
матических формул и т.п.).
11.
По-
следовательность словоформ
(слов
или других языковых объектов),
зарегистрированных в обследован-
ных текстах, снабженных рядом
статистико-информационных ха-
рактеристик и сведенных для ито-
гового анализа в ранжированные
списки. 12. Словарь, содержащий
перечень слов данного языка, рас-
положенный по степени их упот-
ребительности (по алфавиту, ран-
гу или концу слов) с цифровым
указанием частоты встречаемости
и других лингвостатистических па-
раметров (данных). 13. Словарь, в
котором отобраны наиболее упот-
ребительные в речи слова (обычно
в пределах нескольких тысяч).
Частотный словарь-минимум — ча-
стотные словари-минимумы вклю-
чают частотный список и алфавит-
но-частотный список слов и сло-
восочетаний. В частотном списке
вокабулы расположены по убыва-
нию частот начиная с наибольшей.
Словарная статья состоит обычно
из иноязычного слова, имеющего
ранговый номер, буквенное обо-
значение грамматического класса
и частоту употребления в обследо-
ванных текстах. Выходной (пере-
водной) эквивалент здесь не дает-
ся. В алфавитно-частотном словаре
словарная статья состоит из вход-
ной и выходной (переводной) час-
тей. Если в частотном списке приво-
дятся все слова, встречающиеся в
обследованных текстах (или обще-
научные и специальные терминоло-
гические единицы), то в алфавит-
но-частотную часть частотных сло-
варей-минимумов включаются пре-
имущественно отраслевые термины
и частично общенаучные (общетех-
нические) термины, а общеупотре-
бительная лексика сюда не включа-
ется. Входной словник алфавитно-
частотной части двуязычных частот-
ных словарей-минимумов формиру-
ется, как правило, из элементов ча-
стотного списка. Подбор слов для
входного словника осуществляется
с помощью формальных и семанти-
ческих приемов.
Числовая прецизионная информа-
ция — числительные, цифры, даты.
Членение предложения — см. ак-
туальное членение предложения.