РОЗРОБКА МЕТОДУ RAG ДЛЯ НАДАННЯ ІНФОРМАЦІЙНОЇ ПІДТРИМКИ КОРИСТУВАЧАМ

Руслан МОРОЗОВ; Володимир ДОНЕЦЬ

doi:10.32689/maup.it.2025.4.20

Автор(и)

Руслан МОРОЗОВ Харківський національний університет імені В. Н. Каразіна https://orcid.org/0009-0007-7793-1224
Володимир ДОНЕЦЬ Харківський національний університет імені В. Н. Каразіна https://orcid.org/0000-0002-5963-9998

DOI:

https://doi.org/10.32689/maup.it.2025.4.20

Ключові слова:

Retrieval-Augmented Generation (RAG), великі мовні моделі (LLM), інформаційний пошук, економний, Ragas, моделі вбудовування

Анотація

У статті розглядається проблема надання точної та релевантної інформаційної підтримки користувачам у роботі з великими обсягами текстових даних. Звичайні пошукові системи та окремо використані мовні моделі не завжди здатні правильно інтерпретувати зміст запитів і можуть створювати неточні відповіді або галюцинації. Для вирішення цієї проблеми запропоновано гібридний підхід – Retrieval-Augmented Generation (RAG), який поєднує точність інформаційного пошуку з генеративними можливостями LLM. Мета роботи. Розробка та експериментальне тестування повного методу RAG, призначеного для автоматизованої інформаційної підтримки. Ключовою метою є забезпечення економії та високої ресурсної ефективності, що робить метод практично придатним для невеликих організацій, університетських факультетів або інших застосувань з обмеженими обчислювальними бюджетами. Методологія. Запропоновано модульну архітектуру системи, реалізовану з використанням відкритих бібліотек: LangChain для узгодження процесів, ChromaDB як локальне векторне сховище, HuggingFace для доступу до моделей вбудовування та для швидкого та економного виконання запитів LLM використано Groq API. Проведено кілька етапів перевірки: тестування точності пошуку (Top-k) для різних моделей вбудовування на українськомовному наборі даних, тестування якості генерації від початку до кінця з використанням LLM-оцінювача; оптимізація параметрів (підказок, способи розбиття тексту) за допомогою фреймворку Ragas. Наукова новизна. Проведено систематичне порівняння ефективності моделей вбудовування для семантичного пошуку на українськомовному масиві текстів. Експериментально ідентифіковано оптимальний баланс між вартістю та якістю генеративних моделей (LLM), доступних через API. Запропоновано та валідовано економна система RAG, оптимізований за допомогою метрик Ragas для досягнення високої точності відповідей при мінімальних витратах. Висновки. Дослідження підтвердило життєздатність розробленого методу. Модель вбудовування intfloat/ multilingual-e5-large-instruct продемонструвала найкращу точність пошуку, досягнувши 100% у Top-7. Генеративна модель meta-llama/llama-4-scout-17b-16e-instruct показала оптимальне співвідношення ціни та якості (88,3% коректних відповідей). Після налаштування підказок і параметрів фрагментації точність відповідей стала найвищою серед усіх випробуваних варіантів. Перспективи подальшої роботи включають тестування спеціалізованих українських моделей та впровадження системи в реальні чат-боти.

Посилання

A Survey on Hallucination in Large Language Models: Principles, Taxonomy, Challenges, and Open Questions / L. Huang et al. ACM Transactions on Information Systems. 2024. https://doi.org/10.1145/3703155.

Evaluation of a retrieval-augmented generation system using a Japanese Institutional Nuclear Medicine Manual and large language model-automated scoring. Y. Fukui et al. Radiological Physics and Technology. 2025. https://doi.org/10.1007/s12194-025-00941-y.

Evaluating Retrieval-Augmented Generation Models for Financial Report Question and Answering / I. Iaroshev et al. Applied Sciences. 2024. Vol. 14, no. 20. P. 9318. https://doi.org/10.3390/app14209318.

Gao Y. et al. Retrieval-Augmented Generation for Large Language Models: A Survey. arXiv preprint. 2023. arXiv:2312.10997. https://doi.org/10.48550/arXiv.2312.10997.

Hersh W. Search still matters: information retrieval in the era of generative AI. Journal of the American Medical Informatics Association. 2024. https://doi.org/10.1093/jamia/ocae014.

Liu X. A Survey of Hallucination Problems Based on Large Language Models. Applied and Computational Engineering. 2024. Vol. 97, no. 1. P. 24–30. https://doi.org/10.54254/2755-2721/2024.17851.

Patrick L. et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. arXiv preprint. 2020. arXiv:2005.11401. https://doi.org/10.48550/arXiv.2005.11401.

Pokhrel S., K C B., Shah P. B. A Practical Application of Retrieval-Augmented Generation for Website-Based Chatbots: Combining Web Scraping, Vectorization, and Semantic Search. Journal of Trends in Computer Science and Smart Technology. 2024. Vol. 6, no. 4. P. 424–442. https://doi.org/10.36548/jtcsst.2024.4.007.

Ragas. Ragas. URL: https://docs.ragas.io/en/stable/. (дата звернення: 01.11.2025).

Vladimir K. et al. Dense Passage Retrieval for Open-Domain Question Answering. arXiv preprint. 2020. arXiv:2004.04906. https://doi.org/10.48550/arXiv.2004.04906.

РОЗРОБКА МЕТОДУ RAG ДЛЯ НАДАННЯ ІНФОРМАЦІЙНОЇ ПІДТРИМКИ КОРИСТУВАЧАМ

Автор(и)

DOI:

Ключові слова:

Анотація

Посилання

##submission.downloads##

Опубліковано

Як цитувати

Номер

Розділ

Ліцензія

Статті цього автора (авторів), які найбільше читають

Мова