ҚАЗАҚ ТІЛІНДЕГІ ТЕРЕҢ ОҚУ НЕГІЗІНДЕГІ ЖЕК КӨРУШІЛІКТІ АНЫҚТАУ: МӘТІНДІ ТАЛДАУҒА АРНАЛҒАН ГИБРИДТІ ЖҰМЫС
https://doi.org/10.53360/2788-7995-2025-4(20)-25
Аңдатпа
Бұл зерттеу қазақ тіліндегі жек көрушілік сөздерін автоматты түрде анықтауға арналған терең оқыту әдістеріне негізделген жаңа интеллектуалды жүйені ұсынады. Қазақ тілінің ресурсы
аз тіл ретіндегі ерекшелігіне ерекше назар аударылады, мұнда шектеулі тілдік деректер сенімді үлгілерді құруда елеулі қиындықтар туғызады. Сөйлеу контексттерінің кең ауқымын қамтитын көптілді деректер корпусы әртүрлі онлайн-көздерді – әлеуметтік медиа, форумдар және жаңалықтар порталдарын пайдалану арқылы жасалды және алдын ала өңделді. Тиімділікті арттыру үшін гибридті архитектура ұсынылды, оның ішінде конволюциялық нейрондық желілер (CNN), екі жақты ұзақ қысқа мерзімді жадылар (BiLSTMs) және Трансформатордың назар аудару механизмдері. Дәлдік, еске түсіру, F1 критерийі және дәлдік көрсеткіштерін қолдану арқылы бағалау ұсынылған модельдің дәстүрлі машиналық оқыту алгоритмдерінен артықшылығын көрсетті.
Зерттеу нәтижелері қазақ тіліндегі мәтіндерді өңдеудің заманауи әдістерін жетілдіруге, мазмұнды автоматты түрде модерациялау жүйесін дамытуға және қазақтілді пайдаланушылар үшін қауіпсіз, инклюзивті және тұрақты цифрлық экожүйе қалыптастыруға елеулі үлес қосады.
Авторлар туралы
Д. СултанҚазақстан
Данияр Султан – Цифрлық технологиялар мектебінің доценті
050035, Қазақстан Республикасы, Алматы қ, Жандосов көшесі, 55
Р. Абдрахманов
Қазақстан
Рустам Абдрахманов – техника ғылымдарының кандидаты, доценті
161205, Қазақстан Республикасы, Түркістан қаласы, Рабиғи Сұлтан Бегім көшесі, 14А
Эшреф Адалы
Түркия
Эшреф Адалы – PhD, компьютер және информатика факультетінің профессоры
34010, Стамбул
Т. Tурымбетов
Қазақстан
Турсынбай Турымбетов – техника ғылымдарының кандидаты, доценті
161205, Қазақстан Республикасы, Түркістан қаласы, Рабиғи Сұлтан Бегім көшесі, 14А
Г. Бекешова
Қазақстан
Гульвира Бауыржановна Бекешова – Ақпараттық технологиялар факультетінің Ақпараттық қауіпсіздік кафедрасының аға оқытушысы, техникалық ғылымдар магистрі
010000, Қазақстан Республикасы, Астана қаласы, Қ.Сәтбаев көшесі, 2
Әдебиет тізімі
1. Data-Driven Morphological Analysis and Disambiguation for Kazakh / O. Makhambetov et al // Computational Linguistics and Intelligent Text Processing. – 2015. – Р. 151-163. https://doi.org/10.1007/978-3-319-18111-0_12.
2. Assembling the Kazakh Language Corpus / O. Makhambetov et al // in Proc. 2013 Conf. Empirical Methods in Natural Language Processing (EMNLP), Seattle, WA, USA. – 2013. – Р. 1022-1031. [Online]. Available: https://aclanthology.org/D13-1104.
3. Yessenbayev Z. KazNLP: A Pipeline for Automated Processing of Texts Written in Kazakh Language / Z. Yessenbayev, Z. Kozhirbayev, A. Makazhanov // in Speech and Computer. Switzerland: Springer. – 2020. – Р. 657-666. https://doi.org/10.1007/978-3-030-60276-5_63.
4. Document and Word-level Language Identification for Noisy User Generated Text / Z. Kozhirbayev, Z. Yessenbayev, A. Makazhanov // in Proc. 12th Int. Conf. Application of Information and Communication Technologies (AICT), Almaty, Kazakhstan. – 2018. – Р. 1-4. https://doi.org/10.1109/ICAICT.2018.8747138.
5. Yessenbayev Z. KazNLP: A Pipeline for Automated Processing of Texts Written in Kazakh Language / Z. Yessenbayev, Z. Kozhirbayev, A. Makazhanov // in Speech and Computer. LNCS. – 2020. – vol. 12335. – Р. 657-666. https://doi.org/10.1007/978-3-030-60276-5_63.
6. Data-Driven Morphological Analysis and Disambiguation for Kazakh / O. Makhambetov et al // in CICLing. – 2015. – vol. 9041. – Р. 151-163. https://doi.org/10.1007/978-3-319-18111-0_12.
7. Yessenbayev Z. KazNLP: A Pipeline for Automated Processing of Texts Written in Kazakh Language / Z. Yessenbayev, Z. Kozhirbayev, A. Makazhanov // in SPECOM. – 2020. – vol. 12335. – Р. 657-666. https://doi.org/10.1007/978-3-030-60276-5_63.
8. Development of CRF and CTC Based End-To-End Kazakh Speech Recognition System / D. Oralbekova et al // in Intelligent Information and Database Systems. – 2022. – vol. 13757. – Р. 519-531. https://doi.org/10.1007/978-3-031-21743-2_41.
9. A Comparative Analysis of LSTM and BERT Models for Named Entity Recognition in Kazakh Language: A Multi-classification Approach / D. Oralbekova et al // in Modeling and Simulation of Social-Behavioral Phenomena in Creative Societies (MSBC 2024), CCIS. – 2024. – vol. 2211. – Р. 116-128. https://doi.org/10.1007/978-3-031-72260-8_10.
10. Neurocomputer System of Semantic Analysis of the Text in the Kazakh Language / A. Akanova et al // ACM Trans. Asian and Low-Resource Language Information Processing. – 2024. – vol. 23, № 4. https://doi.org/10.1145/3652159.
11. Automatic Recognition of Kazakh Speech Using Deep Neural Networks / O. Mamyrbayev et al // in Asian Conf. Intelligent Information and Database Systems. – 2019. – vol. 11432. – Р. 465-474. https://doi.org/10.1007/978-3-030-14802-7_40.
12. End-to-End Speech Recognition in Agglutinative Languages / O. Mamyrbayev et al // in Intelligent Information and Database Systems. – 2020. – vol. 12034. – Р. 391-401. https://doi.org/10.1007/978-3-030-42058-1_33.
13. A Comparative Analysis of LSTM and BERT Models for Named Entity Recognition in Kazakh Language: A Multi-classification Approach / D. Oralbekova et al // in MSBC. – 2024. – vol. 2211. – Р. 116-128. https://doi.org/10.1007/978-3-031-72260-8_10.
14. Advanced Implementation of a Multilevel Model for Text Summarization in Kazakh Using Pretrained Models / D. Oralbekova et al // Engineering, Technology & Applied Science Research. – 2025. – vol. 15, № 5. – Р. 26711-26721. https://doi.org/10.48084/etasr.12799.
15. A Comparative Analysis of LSTM and BERT Models for Named Entity Recognition in Kazakh Language: A Multi-classification Approach / D. Oralbekova et al // in MSBC 2024, CCIS. – 2024. – vol. 2211. – Р. 116-128. https://doi.org/10.1007/978-3-031-72260-8_10.
16. Development of CRF and CTC Based End-To-End Kazakh Speech Recognition System / D. Oralbekova et al // in ACIIDS. – 2022. – vol. 13757. – Р. 519-531. https://doi.org/10.1007/978-3-031-21743-2_41.
Рецензия
Дәйектеу үшін:
Султан Д., Абдрахманов Р., Адалы Э., Tурымбетов Т., Бекешова Г. ҚАЗАҚ ТІЛІНДЕГІ ТЕРЕҢ ОҚУ НЕГІЗІНДЕГІ ЖЕК КӨРУШІЛІКТІ АНЫҚТАУ: МӘТІНДІ ТАЛДАУҒА АРНАЛҒАН ГИБРИДТІ ЖҰМЫС. Шәкәрім Университетінің Хабаршысы. Техникалық ғылымдар сериясы. 2025;1(4(20)):210-219. https://doi.org/10.53360/2788-7995-2025-4(20)-25
For citation:
Sultan D., Abdrakhmanov R., Adali E., Turymbetov T., Bekeshova G. DEEP LEARNING-BASED HATE SPEECH DETECTION IN KAZAKH: A HYBRID FRAMEWORK FOR ROBUST TEXT ANALYSIS. Bulletin of Shakarim University. Technical Sciences. 2025;1(4(20)):210-219. https://doi.org/10.53360/2788-7995-2025-4(20)-25
JATS XML















