КЛАСТЕРИЗАЦИЯ И КЛАССИФИКАЦИЯ ЗАБОЛЕВАНИЙ С ПОМОЩЬЮ СТОХАСТИЧЕСКОЙ ДИНАМИЧЕСКОЙ ОПТИМИЗАЦИИ
https://doi.org/10.53360/2788-7995-2025-2(18)-3
Аннотация
В данном исследовании представлен новый подход к оптимизации методов обработки естественного языка (NLP) для распознавания медицинских объектов и классификации заболеваний. Используя запросы пациентов и аннотации статей в PubMed, в статье применяются передовые методы извлечения информации для выявления биомедицинских сущностей и заболеваний. Заболевания группируются с помощью комбинации TF-IDF и кластеризации K-means, а затем применяются модели классификации для предсказания кластеров заболеваний на основе известных сущностей.
Ключевым новшеством данной работы является использование стохастической динамической оптимизации для точной настройки параметров, что значительно повышает эффективность кластеризации и классификации. Кроме того, исследование анализирует влияние размеров векторных представлений слов, количества кластеров и глубины дерева решений на итоговую точность модели. Экспериментальные результаты показывают, что предложенный метод повышает точность извлечения и классификации медицинских знаний, превосходя традиционные методы по точности и масштабируемости. Этот масштабируемый и эффективный подход к анализу биомедицинских данных может помочь в принятии клинических решений, обеспечить персонализированную медицину и предоставить ценные сведения о здравоохранении, что будет способствовать улучшению состояния пациентов и повышению эффективности исследовательских процессов.
Об авторах
А. М. АмантайКазахстан
Айгерим Амантай – магистрант,
050000, улица Толе би, 59
Ж. М. Махамбетали
Казахстан
Жандос Махамбетали – магистрант,
050000, улица Толе би, 59
Список литературы
1. Choudhary P. An Intelligent Chatbot Design and Implementation Model Using Long Short-Term Memory with Recurrent Neural Networks and Attention Mechanism / P. Choudhary, S. Chauhan // Decision Analytics Journal. – 2023. – Vol. 9, № 100359. https://doi.org/10.1016/j.dajour.2023.100359.
2. Online Biomedical Named Entities Recognition by Data and Knowledge-Driven Model / Cao Lulu et al // Artificial Intelligence in Medicine. – 2024. – Vol. 150, № 102813. https://doi.org/10.1016/j.artmed.2024.102813.
3. Exploring Named Entity Recognition and Relation Extraction for Ontology and Medical Records Integration / D.P. da Silva et al // Informatics in Medicine Unlocked. – 2023. – Vol. 43, № 101381. https://doi.org/10.1016/j.imu.2023.101381.
4. Medical Named Entity Recognition (MedNER): A Deep Learning Model for Recognizing Medical Entities (Drug, Disease) from Scientific Texts / Miah M.S. Ullah et al // IEEE EUROCON 2023 – 20th International Conference on Smart Technologies. – 2023. – P. 158-162. https://doi.org/10.1109/EUROCON56442.2023.10199075.
5. Named Entity Recognition Based on Boundary Enhanced for Chinese Electronic Medical Records / X. Chen et al // 2023 12th International Conference of Information and Communication Technology (ICTech). – 2023. – P. 73-77. https://doi.org/10.1109/ICTECH58362.2023.00025.
6. Tang L. Named Entity Recognition in Chinese Medical Texts Based on RoBERTa-WWMIDCNN-CRF / L. Tang, J. Kong, L. Xu // 2024 IEEE 25th China Conference on System Simulation Technology and Its Application (CCSSTA). – 2024. – P. 315-319. https://doi.org/10.1109/CCSSTA62096.2024.10691735.
7. Zhang Y. Named Entity Recognition of Medical Examination Reports Based on BiLSTM+CRF Model / Y. Zhang, F. Zhang // 2023 4th International Seminar on Artificial Intelligence, Networking and Information Technology (AINIT). – 2023. – P. 340-344. https://doi.org/10.1109/AINIT59027.2023.10212675.
8. Patient Clustering Optimization with K-Mean in Healthcare Data Analysis / A.K. Rai et al // 2023 International Conference on Artificial Intelligence for Innovations in Healthcare Industries (ICAIIHI). – 2023. – P. 1-7. https://doi.org/10.1109/ICAIIHI57871.2023.10489428.
9. Ershadi Mohammad Mahdi. Applications of Dynamic Feature Selection and Clustering Methods to Medical Diagnosis / Ershadi Mohammad Mahdi, Seifi Abbas // Applied Soft Computing. – 2022. – Vol. 126, № 109293. https://doi.org/10.1016/j.asoc.2022.109293.
10. A Large-Scale Dataset of Patient Summaries for Retrieval-Based Clinical Decision Support Systems / Z. Zhao et al // Scientific Data. – 2023. – Vol. 10, № 909. https://doi.org/10.1038/s41597-023-02814-8.
Рецензия
Для цитирования:
Амантай А.М., Махамбетали Ж.М. КЛАСТЕРИЗАЦИЯ И КЛАССИФИКАЦИЯ ЗАБОЛЕВАНИЙ С ПОМОЩЬЮ СТОХАСТИЧЕСКОЙ ДИНАМИЧЕСКОЙ ОПТИМИЗАЦИИ. Вестник Университета Шакарима. Серия технические науки. 2025;(2(18)):23-30. https://doi.org/10.53360/2788-7995-2025-2(18)-3
For citation:
Amantay A., Makhambetali Zh. CLUSTERING AND CLASSIFICATION OF DISEASES USING STOCHASTIC DYNAMIC OPTIMIZATION. Bulletin of Shakarim University. Technical Sciences. 2025;(2(18)):23-30. https://doi.org/10.53360/2788-7995-2025-2(18)-3