ВПЛИВ ПОПЕРЕДНЬОЇ ОБРОБКИ ДАНИХ НА ПРОДУКТИВНІСТЬ МОДЕЛІ RANDOM FOREST У ВИЯВЛЕННІ МЕРЕЖЕВИХ АТАК
DOI:
https://doi.org/10.31891/2219-9365-2024-80-51Ключові слова:
Random Forest, обробка даних, стандартизація, вибір функцій, нормалізація, імпутація, PCA, машинне навчання, показники продуктивності, попередня обробка данихАнотація
В роботі представлено систему для виявлення мережевих атак із використанням моделі машинного навчання Random Forest. Головною особливістю цієї системи є попередня обробка даних, яка включає стандартизацію, нормалізацію та обробку пропущених значень. Для реалізації моделі було використано комплексний набір даних, що дозволило провести детальний аналіз впливу різних методів обробки даних на продуктивність моделі. Результати дослідження показали, що правильне масштабування та відбір ознак значно покращують точність і ефективність моделі. Крім того, виявлено, що неадекватна обробка пропущених даних може призвести до суттєвого зниження продуктивності. Отримані висновки можуть бути корисними для практиків, які працюють над оптимізацією моделей машинного навчання для виявлення мережевих загроз.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2024 Максим ПРОДЕУС, Андрій НІЧЕПОРУК, Олег ІВАНЧЕНКО

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.