АВТОМАТИЗОВАНЕ ВИЯВЛЕННЯ ТА КЛАСИФІКАЦІЯ НЕОДНОЗНАЧНОСТЕЙ У ВИМОГАХ ДО ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ ІТ-ПРОЄКТІВ З ВИКОРИСТАННЯМ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ ТА RAG-ТЕХНОЛОГІЙ
DOI:
https://doi.org/10.31891/2219-9365-2026-85-53Ключові слова:
вимоги до програмного забезпечення, неоднозначність, великі мовні моделі, RAG, Flan-T5, Chain-of-Thought, автоматизація перевіркиАнотація
Проблема забезпечення якості вимог на ранніх етапах життєвого циклу розробки набуває критичного значення для успіху програмних проєктів, адже наявність лінгвістичних та семантичних неоднозначностей у специфікаціях є однією з головних причин виникнення дефектів, перевитрат бюджету та зривів термінів реалізації. Ручне рецензування документації є надмірно трудомістким та суб’єктивним процесом, а традиційні автоматизовані інструменти на основі правил часто генерують високий рівень хибних спрацювань через нездатність розуміти контекст. Використання великих мовних моделей відкриває нові можливості для семантичного аналізу тексту, проте їх пряме застосування ускладнюється схильністю до галюцинацій та ігноруванням специфічної термінології проєкту.
У статті запропоновано гібридний метод виявлення неоднозначностей у вимогах до програмного забезпечення, що базується на інтеграції великих мовних моделей із технологією пошукового доповнення генерації (RAG). Запропонований підхід ґрунтується на двоагентній архітектурі, яка передбачає послідовну взаємодію агента-ідентифікатора для первинної фільтрації вимог та агента-класифікатора для їх глибокої семантичної типізації згідно зі стандартом IEEE 830. Метод охоплює такі етапи, як сегментація тексту, динамічне збагачення запитів контекстом із бази знань проєкту, застосування стратегії ланцюжка міркувань для генерації пояснень та структурний парсинг результатів.
Експерименти проведено на спеціалізованому датасеті з домену телекомунікацій, що містить 1983 вимоги. Отримані результати засвідчили перевагу розробленого гібридного методу на базі моделі Flan-T5-Large над базовими підходами (Zero-Shot та Few-Shot): метод забезпечує Precision 87%, повноту Recall 91% та F1-score 89%. Додатково підтверджено ефективність використання RAG для зниження кількості хибних спрацювань на вузькоспеціалізованій технічній лексиці та продемонстровано здатність системи надавати інтерпретовані пояснення виявлених дефектів. Результати доводять, що інтеграція контекстно-орієнтованих LLM-агентів істотно підвищує рівень автоматизації та надійності процесу аудиту вимог у сучасних середовищах розробки.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2026 Андрій ТОРОШАНКО

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.

