Наука технології інновації №3(35)-2025, 61-69 с

http://doi.org/10.35668/2520-6524-2025-3-07

Мельник Анастасія Олександрівна — аспірантка, Київський національний університет імені Тараса Шевченка, просп. Академіка Глушкова 4д, м. Київ, Україна, 02000; anastasiia.melnyk@knu.ua; ORCID: 0000-0002-3167-4353

Розора Ірина Василівна — д-р фіз.-мат. наук, Київський національний університет імені Тараса Шевченка, просп. Академіка Глушкова 4д, м. Київ, Україна, 02000; +38 (044) 521-35-35; irozora@knu.ua; ORCID: 0000-0002-8733-7559

ПОРІВНЯЛЬНИЙ АНАЛІЗ МЕТОДІВ ІМПУТАЦІЇ В МОДЕЛЯХ МАШИННОГО НАВЧАННЯ

Резюме. Відсутність даних є поширеною проблемою в аналізі даних і машинному навчанні, що впливає на точність і надійність прогнозних моделей. У цій статті здійснено комплексний аналіз проблеми відсутніх даних, досліджено їхні типи, наслідки та поширені методи імпутації. Використовуючи реальні набори даних, здійснено оцінювання ефективності серединної / медіанної імпутації, імпутації методом k-найближчих сусідів, множинної імпутації, регресійної імпутації та імпутації методом “hot deck” (“гаряча колода”). Окрім того, досліджено те, як ці методи імпутації впливають на моделі машинного навчання, зокрема метод випадкового лісу, градієнтно-бустерні машини та метод опорних векторів. У статті підкреслено необхідність ретельного експериментування та оцінки конкретної моделі під час обробки відсутніх даних, наголошено на критичній ролі вибору відповідних методів імпутації залежно від характеристик набору даних та алгоритмів машинного навчання. Зрештою, висновки підкреслюють важливість адаптованих стратегій імпутації для підвищення продуктивності моделі та забезпечення надійних аналітичних
результатів.

Ключові слова: відсутні дані, методи імпутації, машинне навчання, оціночні метрики, прогнозні моделі.