АВТОМАТИЗОВАНА ПЕРЕВІРКА ТВЕРДЖЕНЬ З ВИКОРИСТАННЯМ RAG-МЕХАНІЗМУ ТА КЛАСИФІКАЦІЇ ОЗНАК

Віталій Валерійович Дадиверін; Олег Володимирович Бісікало

doi:10.32689/maup.it.2026.1.1

Автор(и)

Віталій Валерійович Дадиверін Вінницький національний технічний університет https://orcid.org/0000-0001-5121-2263
Олег Володимирович Бісікало Вінницький національний технічний університет https://orcid.org/0000-0002-7607-1943

DOI:

https://doi.org/10.32689/maup.it.2026.1.1

Ключові слова:

фактчекінг, штучний інтелект, фейкові новини, RAG, мультимодальна модель, трансформери, верифікація тверджень, дезінформація

Анотація

Об’єктом дослідження є проблема автоматичної верифікації фактів у цифровому середовищі, насиченому дезінформацією. У роботі проаналізовано сучасні підходи до детекції фейкових новин, включаючи трансформерні архітектури, нейросемантичні та графові моделі. Додатково визначено обмеження наявних методів, зокрема популярність використання статичних ознак та погану здатність до узагальнення при постійному динамічному потоці інформації. Запропоновано власну архітектуру мультимодальної моделі, яка поєднує класифікацію стилю, детекцію AI-тексту та модуль перевірки фактів, підкріплений пошуком релевантних доказів через RAG-механізм. Результати експериментів на тестовому наборі із 1660 прикладів показали, що модель досягає високого показника Recall (84,6 %), зберігаючи прийнятну збалансованість точності (Accuracy – 78,6 %, Precision – 74,4 %, F1 – 80,8 %). Отримані результати свідчать про достатню ефективність мультизадачного навчання у системах перевірки на правдивість. Це дозволяє ефективно виявляти фейкові новини з різних джерел, хоча й із певною кількістю хибнопозитивних спрацювань, але баланс між високим Recall і нижчим Precision є обґрунтованим, оскільки система орієнтована на зменшення можливості пропуску фейкових новин. Запропонована модель є придатною для використання в реальних умовах моніторингу інформаційного простору, зокрема в контексті протидії інформаційним загрозам. Ефективність моделі пояснюється комбінацією кількох незалежних ознак (стиль, походження, фактологічність) та гнучкою системою інтеграції сигналів. Крім того, використання RAG-механізму забезпечує додатковий рівень інтерпретованості отриманих результатів з прив’язкою до зовнішніх джерел. Її можна застосовувати в онлайн-платформах з великою кількістю неструктурованих повідомлень. Підхід може бути розширений мультимедійним аналізом та адаптований для іншого визначеного мовного середовища.

Посилання

Al-Alshaqi, M., et al. (2024). Ensemble Techniques for Robust Fake News Detection: Integrating Transformers, Natural Language Processing, and Machine Learning. Sensors. Vol. 24(18). Article № 6062. DOI: https://doi.org/10.3390/s24186062

Almandouh, M., et al. (2024). Ensemble based high performance deep learning models for fake news detection. Scientific Reports. Vol. 14. Article № 3863. DOI: https://doi.org/10.1038/s41598-024-76286-0

Al-Ezzi, A. et al. (2022). Analysis of Deep Ensemble Transformer Model for Fake News Detection. IEEE Access. 2022. Vol. 10. P. 107485–107498. DOI: https://doi.org/10.1109/ACCESS.2022.3200595

Md. Ishraquzzaman et al. (2024). Ensemble Transformer-Based Detection of Fake and AI-Generated News. Advances in Computational Intelligence and Systems. Article ID 3268456. DOI: https://doi.org/10.1155/acis/3268456

Varshini, S. S., et al. (2023). I-S2FND: a novel interpretable self-ensembled semi-supervised model based on transformers for fake news detection. Journal of Intelligent Information Systems. Vol. 62. P. 233–250. DOI: https://doi.org/10.1007/s10844-023-00821-0

Yilun, Niu et al. (2024). VeraCT Scan: Retrieval-Augmented Fake News Detection with Justifiable Reasoning. arXiv preprint. arXiv:2404.01920. Available at: https://arxiv.org/abs/2404.01920

Zhao, Z., Zhou, Y., Cheng, Y. (2023). Fake News Detection Based on Knowledge-Guided Semantic Analysis. Journal of Web Engineering. Vol. 22(8). P. 2201–2222. DOI: https://doi.org/10.13052/jwe1540-9589.22811

Devlin, J., Chang, M.-W., Lee, K., Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. P. 4171–4186.

Lewis, P., Perez, E., Piktus, A. et al. (2020). Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. Advances in Neural Information Processing Systems. Vol. 33.

Facebook AI Research. Faiss: A library for efficient similarity search and clustering of dense vectors. GitHub repository. 2019–2023. Retrieved from: https://github.com/facebookresearch/faiss

Wikimedia Foundation. Корпус англомовної Вікіпедії: повне текстове дамп-архівування статей. Wikimedia Downloads. 2023. Retrieved from: https://dumps.wikimedia.org/enwiki/latest/

Перехресна ентропія. Вікіпедія : вільна енциклопедія. 2023. Retrieved from: https://uk.wikipedia.org/wiki/Перехресна_ентропія

Косинус подібності. Вікіпедія : вільна енциклопедія.2023. Retrieved from: https://uk.wikipedia.org/wiki/Ко-синус_подібності. Укр

PyTorch Contributors. torch.optim.AdamW. PyTorch Documentation. 2023. Retrieved from: https://docs.pytorch.org/docs/stable/generated/torch.optim.AdamW.html

Classification: Accuracy, Precision, Recall. Google Developers : Machine Learning Crash Course. – 2023. Retrieved from: https://developers.google.com/machine-learning/crash-course/classification/accuracy-precision-recall

АВТОМАТИЗОВАНА ПЕРЕВІРКА ТВЕРДЖЕНЬ З ВИКОРИСТАННЯМ RAG-МЕХАНІЗМУ ТА КЛАСИФІКАЦІЇ ОЗНАК

Автор(и)

DOI:

Ключові слова:

Анотація

Посилання

##submission.downloads##

Опубліковано

Як цитувати

Номер

Розділ

Ліцензія

Статті цього автора (авторів), які найбільше читають

Мова