ВПЛИВ ПОПЕРЕДНЬОЇ ОБРОБКИ ДАНИХ НА ПРОДУКТИВНІСТЬ МОДЕЛІ RANDOM FOREST У ВИЯВЛЕННІ МЕРЕЖЕВИХ АТАК

Автор(и)

DOI:

https://doi.org/10.31891/2219-9365-2024-80-51

Ключові слова:

Random Forest, обробка даних, стандартизація, вибір функцій, нормалізація, імпутація, PCA, машинне навчання, показники продуктивності, попередня обробка даних

Анотація

В роботі представлено систему для виявлення мережевих атак із використанням моделі машинного навчання Random Forest. Головною особливістю цієї системи є попередня обробка даних, яка включає стандартизацію, нормалізацію та обробку пропущених значень. Для реалізації моделі було використано комплексний набір даних, що дозволило провести детальний аналіз впливу різних методів обробки даних на продуктивність моделі. Результати дослідження показали, що правильне масштабування та відбір ознак значно покращують точність і ефективність моделі. Крім того, виявлено, що неадекватна обробка пропущених даних може призвести до суттєвого зниження продуктивності. Отримані висновки можуть бути корисними для практиків, які працюють над оптимізацією моделей машинного навчання для виявлення мережевих загроз.

##submission.downloads##

Опубліковано

28.11.2024

Як цитувати

ПРОДЕУС, М., НІЧЕПОРУК, А., & ІВАНЧЕНКО, О. (2024). ВПЛИВ ПОПЕРЕДНЬОЇ ОБРОБКИ ДАНИХ НА ПРОДУКТИВНІСТЬ МОДЕЛІ RANDOM FOREST У ВИЯВЛЕННІ МЕРЕЖЕВИХ АТАК. MEASURING AND COMPUTING DEVICES IN TECHNOLOGICAL PROCESSES, (4), 415–419. https://doi.org/10.31891/2219-9365-2024-80-51