МЕТОД ІНТЕЛЕКТУАЛЬНОГО АНАЛІЗУ КОРОТКИХ ВИСОКОВИМІРНИХ ВИБІРОК НА ОСНОВІ БЕГІНГОВОГО АНСАМБЛЮ З АУГМЕНТАЦІЄЮ ДАНИХ
DOI:
https://doi.org/10.31891/2219-9365-2025-83-19Ключові слова:
малі дані, високорозмірні дані, нейронна мережа узагальненої регресії, аугментація даних, ансамблеве навчання, беггінг, регресіяАнотація
Однією з постійних і критичних проблем у застосуванні методів машинного навчання та статистичного аналізу в медичній галузі залишається ефективна обробка малих даних – наборів даних, що містять обмежену кількість спостережень з практичних, етичних або біологічних причин. На відміну від масштабних популяційних досліджень або широких епідеміологічних баз даних, багато реальних клінічних сценаріїв передбачають роботу з невеликими вибірками: дані окремих пацієнтів, рідкісні захворювання, дослідження на ранніх стадіях або спеціалізовані діагностичні процедури. Як результат, дослідники та медики часто змушені працювати з неповними, розрідженими або дуже незбалансованими даними, щоб створити точні та надійні моделі, які можна використовувати для прийняття важливих клінічних рішень. Таким чином, розробка ефективних, надійних та інтерпретованих методів обробки коротких даних є не лише методологічною необхідністю, але й практичною вимогою сучасної медицини. Одним з найпоширеніших способів часткового вирішення проблеми аналізу невеликих вибірок є доповнення даних. Збільшення кількості екземплярів у навчальному наборі часто позитивно впливає на точність моделей. Однак у випадку доповнених даних покладатися на одну стратегію моделювання іноді недостатньо. Часто поєднання підходів аугментації та ансамблевого навчання може призвести до значного покращення стійкості та продуктивності моделі.
У цій статті розроблено новий метод інтелектуального аналізу коротких багатовимірних вибірок даних для розв’язання задач регресійного моделювання, заснований на використанні бегінгового ансамблю штучних нейронних мереж з додатковою процедурою аугментації даних. Детально описані його алгоритм навчання та результати. За допомогою цього методу було вирішено дві медичні задачі: прогнозування рівня крихкості кісток у пацієнтів з остеоартритом та відсотка жиру в організмі. За результатами порівняння основних метрик ефективності розробленого підходу та базових моделей, розроблений метод продемонстрував найкращі результати для обох задач. Розроблений бегінговий ансамбль може бути використаний у випадках, коли обсяг доступних даних обмежений, а класичні моделі не забезпечують необхідної точності.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2025 Мирослав ГАВРИЛЮК

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.