Лыченко Наталья Михайловна – д-р техн. наук, профессор кафедры информационных и вычислительных технологий КРСУ, тел.: +996-555 788735, e-mail: nlychenko@mail.ru
Сороковая Анастасия Валерьевна – магистрант кафедры информационных и вычислительных технологий КРСУ, тел.: +996-550 361866, e-mail: nastusha24sh-g@yandex.com
КЛАССИФИКАТОР ТОНАЛЬНОСТИ ТЕКСТОВ НА ОСНОВЕ LSTM-НЕЙРОННОЙ СЕТИ
Обосновано применение LSTM-сети для решения задачи классификации тональности текстов и на основе этой модели разработаны нейросетевой классификатор и программная система для классификации тональности текстов. Программная система представляет собой библиотеку программных модулей, отвечающих за алгоритмы считывания текстов, токенизации, векторного представления слов, классификации тональности текстов и оценки качества алгоритмов и Web API, который обслуживает запросы клиента с использованием разработанной библиотеки.
Ключевые слова на русском языке:определение тональности текста; задача классификации; токенизация; нейронные сети; LSTM-сеть; библиотека программных модулей; WEB API
LSTM-НЕЙРОН ТАРМАГЫНЫН НЕГИЗИНДЕ ТЕКСТТЕРДИН ТОНАЛДУУЛУГУНУН КЛАССИФИКАТОРУ
Бул макалада тексттердин тоналдуулугунун классификациясы маселесин чечүү үчүн LSTM-тармагын колдонуунун зарылдыгы негизделди жана ушул моделдин негизинде нейрон тармактык классификатору жана тексттердин тоналдуулугунун классификациялоо үчүн программалык система иштелип чыкты. Программалык система программалык модулдардын китепканасы болуп эсептелет жана ал тексттерди эсептөө алгоритмдери, сөздөрдү токенизациялоо, вектордук көрсөтмө, тексттердин тоналдуулугунун классификациясы жана алгоритмдердин жана WebAPI дын сапатын баалоо үчүн жооп берет. Ал иштелип чыккан китепкананы пайдалануу менен кардарлардын суроо-талабын тейлейт.
Ключевые слова на кыргызском языке:тексттин тоналдуулугун аныктоо; классификациясынын милдети; токенизация; нейрон тармагы; LSTM-тармагы; программалык модулдардын китепканасы; WEB API
CLASSIFIER OF TEXT SENTIMENT BASED ON LSTM-NEURAL NETWORK
The application of the LSTM network for solving the problem of text sentiment classification is justified. On the basis of this model a neural network classifier and a software system for classifying text tonality are developed. The software system consists from a library of software modules responsible for the algorithms of reading of text, tokenization, vector representation of words, text sentiment classification and quality assessment of algorithms, and the Web API that serves client requests using the developed library.
Ключевые слова на английском языке:sentiment analysis; classification; tokenization; neural networks; LSTM network; software module library; WEB API