ЖАНРОВА КЛАСИФІКАЦІЯ ЛІТЕРАТУРИ ЗА МЕТРИКАМИ ЗА ДОПОМОГОЮ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ

Автор(и)

DOI:

https://doi.org/10.32689/maup.philol.2025.1.11

Ключові слова:

жанрова класифікація, великі мовні моделі, параметризація текстів, жанрові онтології, обробка природної мови, автоматизований аналіз текстів

Анотація

У статті проаналізовано можливість використання великих мовних моделей для жанрової класифікації літературних текстів із застосуванням метрик параметризації та жанрових онтологій. Розглянуто теоретичні основи жанрової класифікації, зокрема традиційні підходи до визначення жанрів та сучасні алгоритмічні методи, що використовують великі мовні моделі. Значну увагу приділено вибору метрик для параметризації текстів, серед яких: рівень формальності, глибина технічного аналізу, методологічний підхід, цільова аудиторія, область застосування, тип даних у дослідженні, наявність емпіричних результатів і спосіб візуалізації інформації. Запропоновано використання багаторівневої класифікації, що дозволяє більш точно ієрархічно структурувати жанрові ознаки. Метою роботи є розглянути основні метрики параметризації жанрової класифікації літератури, а також провести практичний експеримент із класифікації наукових робіт предметної галузі “штучний інтелект”. Наукова новизна статті полягає у розробці та застосуванні комплексної параметризації жанрів літератури на основі чітко визначених метрик, що дозволяє використовувати великі мовні моделі для автоматизованої жанрової класифікації.У рамках дослідження було проведено практичний експеримент із жанровою класифікацією 10 наукових робіт у галузі штучного інтелекту. Аналіз здійснювався за допомогою GPT-4o та супутніх алгоритмів машинного навчання. Отримані результати підтвердили ефективність параметризації текстів за визначеними метриками та їх використання для автоматизованої класифікації. Було виявлено, що великі мовні моделі демонструють високу точність у визначенні ключових характеристик текстів, проте мають труднощі з розпізнаванням змішаних жанрів та пояснюваністю класифікаційних рішень.Основними викликами автоматизованої жанрової класифікації є розмитість жанрових меж, вплив навчального корпусу на результати класифікації, необхідність підвищення пояснюваності класифікаційних рішень та адаптація моделей до специфіки різних жанрів. Запропоновано напрямки подальших досліджень, зокрема інтеграцію жанрових онтологій, покращення параметризації текстів і розробку алгоритмів, здатних працювати з багаторівневою жанровою структурою.Таким чином, дослідження підтвердило перспективність використання великих мовних моделей для автоматизованої класифікації літератури за метриками, проте потребує подальшого вдосконалення алгоритмів та підходів до параметризації текстів.

Посилання

Бехта І. А., Марчук О. В. Структурно-типологічна параметризація художнього текстопростору англомовного фентезі. Науковий вісник Міжнародного гуманітарного університету. Сер.: Філологія. 2021. Вип. 47. №. 1. С. 17–21.

Бовсунівська Т. В. Теорія літературних жанрів : Жанрова парадигма сучасного зарубіжного роману : Підручник / Т.В. Бовсунівська. К.: Видавничополіграфічний центр «Київський університет». 2009. 519 с.

Ворочек О. Г., Соловей І. В. Використання мовних моделей штучного інтелекту для генерації публікацій у соціальних мережах. Технічна інженерія. 2024. Вип. 1. №. 93. С. 128–134. DOI: https://doi.org/10.26642/ten-2024-1(93)-128-134.

Драненко Г. Теорія літературних жанрів у світлі сучасних міждисциплінарних учень: емпіричний та онтологічний дискурси. Науковий вісник Східноєвропейського національного університету імені Лесі Українки. 2015. Вип. 8. С. 49–56.

Doulaty M., Saz O., Raymond W. M. Automatic Genre and Show Identification of Broadcast Media. 17th Annual Conference of the International Speech Communication Association, Interspeech. San Francisco, USA. Duration: September 8-12, 2016. P. 2115–2119. https://doi.org/10.48550/arXiv.1606.03333

Garbacz P. An Outline of a Formal Ontology of Genres. Conference: Knowledge Science, Engineering and Management, First International Conference. Guilin, China. Duration: August 5-8, 2006. P. 151–163. DOI: 10.1007/11811220_14.

Lepekhin M., Sharoff S. Estimating Confidence of Predictions of Individual Classifiers and Their Ensembles for the Genre Classification Task. 2022. https://doi.org/10.48550/arXiv.2206.07427.

Martin C., Hood D. The Use of Natural Language Processing in Literature Reviews. 2024. URL: https:// insights.axtria.com/hubfs/thought-leadership-whitepapers/Axtria-Insights-White-Paper-The-Use-of-Natural- Language-Processing-in-Literature-Reviews.pdf

Mu Y., Dong C., Bontcheva K., Song X. Large Language Models Offer an Alternative to the Traditional Approach of Topic Modelling. 2024. https://doi.org/10.48550/arXiv.2403.16248.

Peng X. A Comparative Study of Neural Network for Text Classification. 2020 IEEE Conference on Telecommunications, Optics and Computer Science (TOCS). Shenyang, China. Duration: December 11-13, 2020. P. 2115–2119. DOI: https://doi.org/10.1109/TOCS50858.2020.9339702.

Schreiber H. Genre Ontology Learning: Comparing Curated with Crowd-Sourced Folksonomies. Proceedings of the 17th International Society for Music Information Retrieval Conference. New York City, USA. Duration: August 7-11, 2016. P. 400–406. URL: https://archives.ismir.net/ismir2016/paper/000074.pdf.

Sobchuk O., Sela A. Computational thematics: Comparing algorithms for clustering the genres of literary fiction. 2023. URL: https://doi.org/10.48550/arXiv.2305.11251.

The CWRC Genre Ontology Specification 0.7: вебсайт. URL: https://sparql.cwrc.ca/ontologies/genre. html (дата звернення: 24.02.2025).

##submission.downloads##

Опубліковано

2025-03-27

Як цитувати

ПАСІЧНИК, В., & ЯРОМИЧ, М. (2025). ЖАНРОВА КЛАСИФІКАЦІЯ ЛІТЕРАТУРИ ЗА МЕТРИКАМИ ЗА ДОПОМОГОЮ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ. Наукові праці Міжрегіональної Академії управління персоналом. Філологія, (1 (15), 60-68. https://doi.org/10.32689/maup.philol.2025.1.11