Садыков Ташполот Садыкович – д-р филол. наук, профессор Международного университета Ала-Тоо, тел.: (996-555) 963048, e-mail: tash_sadykov@mail.ru
Шаршембаев Бакыт Шаршембаевич – канд. филол. наук, доцент Кыргызско-турецкого университета “Манас”, тел.: (996-552) 010558, e-mail: bakyt101@mail.ru
Көчкөнбаева Буажар Осмоналиевна – ст. преподаватель Ошского технологического университета, тел.: (996-778) 076200, e-mail: buajar@mail.ru
МОРФОЛОГИЧЕСКИЕ РАЗМЕТКИ ДЛЯ НАЦИОНАЛЬНОГО КОРПУСА
Идентификация категорий частей речи и их распределение в текстах является одной из сложнейших проблем тюркологии. В отличие от флективных языков в тюркских языках слова и словоформы чаще подвергаются явлениям конверсии и омонимии. Для разметки морфологических категорий слов и словоформ в корпусе, а также для снятия текстовой омонимии предлагается система морфологической разметки, совместимой с унифицированной системой для национального корпуса тюркских текстов.
Ключевые слова на русском языке:части речи; морфологические категории; система морфологической разметки; национальный корпус.
МОРФОЛОГИЧЕСКИЕ РАЗМЕТКИ ДЛЯ НАЦИОНАЛЬНОГО КОРПУСА
Идентификация категорий частей речи и их распределение в текстах является одной из сложнейших проблем тюркологии. В отличие от флективных языков в тюркских языках слова и словоформы чаще подвергаются явлениям конверсии и омонимии. Для разметки морфологических категорий слов и словоформ в корпусе, а также для снятия текстовой омонимии предлагается система морфологической разметки, совместимой с унифицированной системой для национального корпуса тюркских текстов.
Ключевые слова на кыргызском языке:части речи; морфологические категории; система морфологической разметки; национальный корпус.
MORPHOLOGICAL TAGGING FOR THE NATIONAL CORPUS
The identification of parts of speech and their distribution in the texts is one of the most complicated problems of Turkology. In contrast of inflectional languages in Turkic languages words and word forms undergo phenomenon of conversion and homonymy. For marking of morphological categories of words and word forms in the corpus, and also for theremoval of a text homonymy, the system of morphological tagging compatible to the unified system for the national corpus of Turkic texts is offered.
Ключевые слова на английском языке:parts of speech; morphological categories; system of the morphological tagging; national corpus.