software
  • формат dict, image
  • размер 48,42 МБ
  • добавлен 22 мая 2014 г.
Хаген М. Полная парадигма Русского языка. Морфология. Частотный словарь
Словарь содержит более 4 млн. словоформ для более чем 130 тыс. лемм.
Количество заголовков / карточек : 2.401.262 / 2.401.262
Автор: shrekello
Словарь составлен на основе известного анонимного файла "Полная акцентуированная парадигма по Зализняку" и существенно расширен за счет таких словарей в электронном виде, как "Лопатин В.В. Полный орфографический словарь русского языка", "Словарь иностранных слов, Москва: Русский язык, 1988", "Новый толково-словообразовательный словарь русского языка. Автор Т. Ф. Ефремова. 2000 г." (все эти файлы доступны на http://www.speakrus.ru/dict/) и некоторых онлайн-словарей.
Структура словаря: словарные статьи отделены друг от друга пустой строкой; каждая статья начинается леммой, за ней следуют строки относящихся к ней словоформ. Каждая строка состоит из трёх полей, разделенных символом табуляции: собственно слово, его морфологические характеристики и некий уникальный цифровой код, однозначно идентифицирующий словоформу. Неупотребляемые словоформы отмечены звёздочкой (отмечены не все) - особенно это относится к прилагательным, образованным от причастий и совпадающих с ними.
Морфологическая характеристика приводится для каждой словоформы, состоит из цепочки прозрачных по смыслу сокращений, разделённых пробелами.
Некоторые пояснения по морфологическим характеристикам:
- для предлогов указан падеж, который имеет управляемое слово;
- для существительных приводится признак одушевлённости/неодушевлённости, а если он не указан, то словоформа имеет этот признак, зависящий от его лексического значения;
- сокращение "общ" указывает на общий род (мужской и женский);
- сокращения "парт", "счет", "мест", "зват" указывают на партитивный, счетный, местный и звательный падежи соответственно;
- для несклоняемых существительных падеж не приводится;
- для наречий после их морфологических характеристик приводятся сокращения лексико-грамматических групп, к которым они относятся.
Словоформы в полном составе даются не для всех лемм: например, для леммы "пистоль 13971" (женский род) не указаны словоформы множественного числа, так как они полностью совпадают со словоформами множественного числа леммы "пистоль 136494" и не отличаются от них семантически.
В некоторых случаях приведены, казалось бы, совершенно одинаковые леммы с идентичными наборами словоформ - "сливка 158366" и "сливка 4154700", но это существенно разные слова, как по словообразованию, так и морфемному составу: первая - "уменьшительное от "слива"", вторая - "процесс действия по значению глагола "сливать"". В других случаях - "выкрашивать 178604" - приведена только одна лемма с одним набором словоформ, хотя леммы с толкованиями "покрывать, пропитывать краской; окрашивать" и "раскрошив, доставать, извлекать из середины" имеют разные корни (такая неоднозначность разрешается в другой части словаря ).
Для части словаря есть расширения: частотность лемм; ударения; произношение (ё/е и э/е); морфемный состав; словообразование; толкование лемм.
В архиве, кроме скомпилированного LSD файла словаря (для Lingvo x5), находятся исходные файлы (*.dsl, *.ann, *.bmp), которые можно подключить к GoldenDict или использовать для компиляции в более ранних версиях Lingvo.