Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву
Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Представление морфологической информации в модуле лемматизации отдела рро ипииСодержание книги
Поиск на нашем сайте Способ представления МИ в модуле лемматизации РРО представлен в таблице 6.3. Он позволяет экономить 2 байта на каждой записи, по сравнению с модулем LINGUIST. Это является существенной экономией дискового пространства, так как предполагаемое количество записей – 2 млн. Кроме того, определение значений отдельных категорий МИ в модуле лемматизации не уступает в простоте и скорости модулю LINGUIST. Для извлечения МИ, используются маски категорий МИ, приведенные в таблице 6.4. Определение значения одной из категорий, например рода, происходит путём применения операции побитового «и» значения МИ и маски категорий. Если словоформе категория не присуща, то результат операции побитового «и» её МИ и маски этой категории будет равен 0. Приведем примеры извлечения значений отдельных категорий морфологической информации. Пример 3. Определение значения категории «род» словоформы:
MI & rod_mask
Результат: _Masculine, _Feminine, _Neuter или 0. Пример 4. Определение падежа слова, с морфологической информацией MI:
MI & case_mask
Результат – 0, если слово не склоняется по падежам (глагол, наречие и т.д), или одно из численных значений категории «падеж», приведенных в таблице 6.3.
Зная МИ слов предложения, можно проводить его синтаксический анализ (СА).
Таблица 6.3. – Представление МИ в модуле лемматизации
Таблица 6.4. – Маски категорий МИ
Лекция 7
В данной лекции будут рассмотрены понятия синтаксиса, синтаксической единицы и синтаксической связи, описаны средства выражения синтаксических связей русского языка в словосочетаниях, а также даны типы связей между словами в словосочетаниях.
Синтаксис изучает правила связывания слов и форм слов, а также единства, в составе которых эти правила реализуются — синтаксические единицы. Минимальной составляющей синтаксических единиц является слово (лексема) и форма слова, т.е. высшие морфологические единицы. Более крупными синтаксическими единицами являются: словосочетание; простое предложение; сложное предложение. Задача синтаксического анализа (СА) состоит в том, чтобы, используя МИ о словоформах, полученную на этапе МА, и сведения из словаря, построить синтаксическую структуру входного предложения (осуществить разбор предложения). Синтаксическая структура отражает синтаксические связи, существующие между синтаксическими единицами.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Последнее изменение этой страницы: 2017-02-07; просмотров: 220; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 216.73.216.146 (0.007 с.) |