АВТОМАТИЗОВАНЕ ВИЯВЛЕННЯ ТА КЛАСИФІКАЦІЯ НЕОДНОЗНАЧНОСТЕЙ У ВИМОГАХ ДО ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ ІТ-ПРОЄКТІВ З ВИКОРИСТАННЯМ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ ТА RAG-ТЕХНОЛОГІЙ

Богдан ВОНСОВИЧ; Руслан БАГРІЙ; Тетяна СКРИПНИК; Олександр ПАСІЧНИК

doi:10.31891/2219-9365-2026-85-53

Автор(и)

Богдан ВОНСОВИЧ Хмельницький національний університет https://orcid.org/0009-0002-9746-5287
Руслан БАГРІЙ Хмельницький національний університет https://orcid.org/0000-0001-5219-1185
Тетяна СКРИПНИК Хмельницький національний університет https://orcid.org/0000-0002-8531-5348
Олександр ПАСІЧНИК Хмельницький національний університет https://orcid.org/0000-0002-8760-4688

DOI:

https://doi.org/10.31891/2219-9365-2026-85-53

Ключові слова:

вимоги до програмного забезпечення, неоднозначність, великі мовні моделі, RAG, Flan-T5, Chain-of-Thought, автоматизація перевірки

Анотація

Проблема забезпечення якості вимог на ранніх етапах життєвого циклу розробки набуває критичного значення для успіху програмних проєктів, адже наявність лінгвістичних та семантичних неоднозначностей у специфікаціях є однією з головних причин виникнення дефектів, перевитрат бюджету та зривів термінів реалізації. Ручне рецензування документації є надмірно трудомістким та суб’єктивним процесом, а традиційні автоматизовані інструменти на основі правил часто генерують високий рівень хибних спрацювань через нездатність розуміти контекст. Використання великих мовних моделей відкриває нові можливості для семантичного аналізу тексту, проте їх пряме застосування ускладнюється схильністю до галюцинацій та ігноруванням специфічної термінології проєкту.

У статті запропоновано гібридний метод виявлення неоднозначностей у вимогах до програмного забезпечення, що базується на інтеграції великих мовних моделей із технологією пошукового доповнення генерації (RAG). Запропонований підхід ґрунтується на двоагентній архітектурі, яка передбачає послідовну взаємодію агента-ідентифікатора для первинної фільтрації вимог та агента-класифікатора для їх глибокої семантичної типізації згідно зі стандартом IEEE 830. Метод охоплює такі етапи, як сегментація тексту, динамічне збагачення запитів контекстом із бази знань проєкту, застосування стратегії ланцюжка міркувань для генерації пояснень та структурний парсинг результатів.

Експерименти проведено на спеціалізованому датасеті з домену телекомунікацій, що містить 1983 вимоги. Отримані результати засвідчили перевагу розробленого гібридного методу на базі моделі Flan-T5-Large над базовими підходами (Zero-Shot та Few-Shot): метод забезпечує Precision 87%, повноту Recall 91% та F1-score 89%. Додатково підтверджено ефективність використання RAG для зниження кількості хибних спрацювань на вузькоспеціалізованій технічній лексиці та продемонстровано здатність системи надавати інтерпретовані пояснення виявлених дефектів. Результати доводять, що інтеграція контекстно-орієнтованих LLM-агентів істотно підвищує рівень автоматизації та надійності процесу аудиту вимог у сучасних середовищах розробки.

Автор(и)

DOI:

Ключові слова:

Анотація

##submission.downloads##

Опубліковано

Як цитувати

Номер

Розділ

Ліцензія

Мова

Інформація

StrikePlagiarism

Індексація