Джумалиева Гульнура Кабылбековна – д-р филос. наук, доцент отделения кыргызско-английского синхронного перевода гуманитарного факультета Кыргызско-Турецкого университета «Манас», г. Бишкек, тел.: +996-550 448443, е-mail: gulnur.jumalieva@manas.edu.kg
Касиева Аида Аскарбековна – канд. филол. наук, доцент отделения кыргызско-английского синхронного перевода гуманитарного факультета Кыргызско-Турецкого университета «Манас», г. Бишкек, тел.: +996-552 004254, е-mail: aida.kasieva@manas.edu.kg
Мусажанова Сейде Жолдошбековна – магистрант отделения кыргызско-английского синхронного перевода Института социальных наук Кыргызско-Турецкого университета «Манас», г. Бишкек, тел.: +996-705 377641, е-mail: musazhanova.seide@gmail.com
АДАПТАЦИЯ ТЕРМИНОВ ВЕБ-ПРОЕКТА УНИВЕРСАЛЬНЫЕ ЗАВИСИМОСТИ НА КЫРГЫЗСКИЙ ЯЗЫК
Рассматриваются синтаксическая аннотация кыргызского языка и связанные с ней термины посредством языковых корпусов и веб-проектов. При компьютерной обработке языковых корпусов токены, леммы, морфологические теги (POS-теги), синтаксические аннотации слов в текстах сначала помечаются вручную. Далее они автоматически выполняются через компьютерную программу и начинается процесс обработки естественного языка – Natural Language Processing. Однако кыргызские эквиваленты и переводы терминов этой новой отрасли ещё недостаточно освоены. Поэтому одной из целей данной статьи является адаптация терминов веб-проекта универсальные зависимости (Universal Dependencies, далее УЗ) на кыргызский язык. Веб-проект УЗ направлен на выполнение синтаксической аннотации при обработке естественного языка, интерпретации грамматических признаков языков мира и адаптации их к унифицированным наборам языковых признаков, приведённым в единый стандарт. К сожалению, в настоящее время кыргызский язык не включён в список языков, на которых работает веб-проект универсальные зависимости. В связи с этим в данной работе представлены примеры синтаксических аннотаций кыргызского языка с учётом принципов вышеуказанного веб-проекта.
Ключевые слова на русском языке:языковой корпус; кыргызский корпус; обработка естественного языка; универсальные зависимости; древовидные структуры (treebank); синтаксическая аннотация; морфологические т
УНИВЕРСАЛДУУ КӨЗ КАРАНДЫЛЫК ВЕБ-ДОЛБООРУНУН ТЕРМИНДЕРИН КЫРГЫЗ ТИЛИНЕ ЫӉГАЙЛАШТЫРУУ
Макалада кыргыз тилинин синтаксистик аннотациясы жана ага байланыштуу терминдер тил корпустары жана веб-долбоорлор аркылуу каралат. Тил корпустарын компьютердик иштетүүдө токендер, леммалар, морфологиялык тегдер (POS-тегдер), тексттердеги сөздөрдүн синтаксистик аннотациялары алгач кол менен белгиленет. Андан кийин алар автоматтык түрдө компьютердик программа аркылуу аткарылат жана табигый тилди – Natural Language Processing иштетүү процесси башталат. Бирок бул жаңы тармактын терминдеринин кыргыз эквиваленттери жана котормолору азырынча жетиштүү деңгээлде өздөштүрүлө элек. Ошондуктан бул макаланын максаттарынын бири универсалдуу көз карандылык (Universal Dependencies) веб-долбоорунун терминдерин кыргыз тилине ылайыкташтыруу болуп саналат. Универсалдуу көз карандылык веб-долбоору табигый тилди иштетүүдө синтаксистик аннотацияны аткарууга, дүйнө тилдеринин грамматикалык белгилерин чечмелөөгө жана аларды бирдиктүү стандартка келтирген тилдик белгилердин бирдейлештирилген топтомуна ылайыкташтырууга багытталган. Эгерде бирдейлештирүү мүмкүн болбосо, анда бул тилдин өзгөчөлүгүн сактап калуу керек. Тилекке каршы, учурда кыргыз тили универсалдуу көз карандылык веб-долбоору иштеген тилдердин тизмесине киргизилген эмес. Ушуга байланыштуу бул эмгекте жогоруда аталган веб-долбоордун принциптерин эске алуу менен кыргыз тилинин синтаксистик аннотацияларынын мисалдары келтирилген.
Ключевые слова на кыргызском языке:тилдик корпус; кыргыз корпусу; табигый тилди иштетүү; универсалдуу көз карандылык; дарак түрүндөгү түзүмдөр (treebank); синтаксистик аннотация; морфологиялык тегдер
ADAPTATION OF THE TERMS OF THE WEB PROJECT UNIVERSAL DEPENDENCIES INTO THE KYRGYZ LANGUAGE
This article is aimed at discussing the syntactic annotation of the Kyrgyz language and related terms through language corpora and web projects. During computer processing of language corpora, actions such as tokens, lemmas, morphological tags (POS tags), and syntactic annotation of words in the texts inside them are fi rst marked manually. Then they are automatically executed through a computer (natural language processing - NLP). However, the Kyrgyz equivalents and translations of the terms of this new sphere have not yet been suffi ciently mastered. Therefore, one of the goals of this article is to adapt the terms of the Universal Dependencies web project into the Kyrgyz language. The Universal Dependencies web project is aimed at performing syntactic annotation in natural language processing, interpreting the grammar of the world’s languages, and adapting them to categories given in accordance with a single standard. Unfortunately, currently, the Kyrgyz language is not included in the list of languages in which the Universal Dependency web project works. In this regard, in this paper, we will discuss the examples that we have prepared as a proposal of syntactic models of the syntactic annotation of the Kyrgyz language for the above-mentioned web project.
Ключевые слова на английском языке:Language corpus; Kyrgyz corpus; Natural Language Processing; Universal Dependencies; tree structures (treebank); syntactic annotation; morphological tags