Математика - - Выбор предикторов - 2 часть + конспект от YandexGPT
Математика - - Выбор предикторов - 2 часть конспект от YandexGPT
00:04 Линейная модель и мультиколлинеарность
• В видео обсуждается линейная модель и мультиколлинеарность, которая может привести к проблемам с предсказанием.
• Для решения этой проблемы используется метод выбора наилучших предикторов, который выбирает те, которые обладают наивысшими оценками.
05:53 Выбор предикторов и их влияние
• В видео объясняется, как использовать метод выбора наилучших предикторов для определения наиболее значимых предикторов в модели.
• Обсуждается, что выбор предикторов должен быть основан на экспертных знаниях и не должен быть сделан автоматически.
• Также объясняется, что мультиколлинеарность может привести к проблемам с предсказанием, но это не всегда так.
• В видео также обсуждаются различные аспекты мультиколлинеарности и их влияние на предсказание.
19:13 Обсуждение методов отбора предикторов
• В видео обсуждается использование различных методов отбора предикторов в модели.
• Один из методов - использование функции “Select“ из библиотеки Python.
• Однако, автор видео утверждает, что этот метод не имеет смысла, так как он может привести к неправильным выводам и отнять время.
27:28 Рекурсивный метод отбора предикторов
• В видео предлагается использовать рекурсивный метод отбора предикторов, который заключается в удалении предикторов с наименьшим коэффициентом корреляции.
• Этот метод может быть оправдан, если мы знаем, какие предиктора не важны, и хотим построить модель с меньшим количеством предикторов.
34:00 Влияние единиц измерения на вероятность дефолта
• В видео обсуждается влияние единиц измерения на вероятность дефолта.
• Например, если мы измеряем долги в миллионах рублей, а не в рублях, то коэффициент корреляции может измениться.
• Это может быть использовано для профилактики сердечно-сосудистых катастроф, так как увеличение единиц измерения может привести к увеличению вероятности дефолта.
37:51 Стандартизация признаков
• В видео обсуждается важность стандартизации признаков в линейной регрессии для получения корректных результатов.
• Объясняется, что стандартизация позволяет сравнивать признаки с разными единицами измерения и делает их безразмерными величинами.
46:22 Пример использования стандартизации
• В качестве примера рассматривается задача прогнозирования уровня артериального давления в зависимости от возраста и окружности талии.
• Объясняется, как стандартизация признаков позволяет избежать ошибок при сравнении коэффициентов и получить корректные результаты.
50:21 Применение стандартизации в других задачах
• В качестве домашнего задания предлагается стандартизировать признаки и посмотреть, как это повлияет на результаты.
• Также обсуждается важность отбора предикторов в задачах прогнозирования и использование различных методов для оценки качества построенных моделей.
54:56 Проблемы с отбором признаков
• Обсуждаются проблемы с отбором признаков, включая необходимость указания количества признаков и их выбор из лучших или худших.
• Упоминается, что даже лучшие методы отбора требуют указания количества признаков или их выбора из лучших или худших.
57:03 Статистический подход к отбору признаков
• Обсуждается статистический подход к отбору признаков, основанный на проверке гипотез.
• Упоминается, что этот подход реализован в библиотеке sklearn, но не включен в нее.
01:00:00 Частотный подход к отбору признаков
• Обсуждается частотный подход к отбору признаков, который оценивает вероятность события, а не его правдоподобие.
• Упоминается, что частотный подход не учитывает априорную вероятность, что может привести к ошибочным суждениям.
01:06:25 Отказ от статистического подхода
• Авторы библиотеки sklearn отказались от статистического подхода, обосновывая это тем, что он не всегда конструктивен и не всегда обоснован.
• Вместо этого они используют другие методы, такие как метод регуляризации некорректно поставленных задач.
01:08:16 Домашнее задание
• Домашнее задание состоит в чтении и выполнении параграфа 5.6 из главы 5 “Множественная линейная регрессия“ в книге “Машинное обучение с использованием Python“.
• В этом параграфе обсуждаются гипотезы о том, что модель с предиктором и модель без предиктора статистически не отличаются друг от друга.
Весь плейлист:
5 views
1015
338
2 months ago 00:03:40 3
2024 (MVK). Белая грива - Руслан Богатырев
2 months ago 00:02:15 1
Российские учёные первыми в мире создали препарат от болезни Бехтерева
2 months ago 00:18:36 1
ЭЙЛЕР. Грандиозное математическое наследие
2 months ago 00:06:35 1
Городок - Учёный у Мэра
2 months ago 00:06:34 1
Я ЕМ ЭТО КАЖДЫЙ ДЕНЬ И ВАМ РЕКОМЕНДУЮ! Знаменитый Ученый Лео Бокерия о секретах долголетия
2 months ago 00:09:10 1
ВОТ ПОЧЕМУ ОБ ЭТОМ МОЛЧАТ..Гениальный ученый Карл Юнг про Создателя
2 months ago 01:59:37 1
Двойная жизнь Пушкина: о чем не говорили в школе. Сергей Сурин о женщинах, облысении и заработках
2 months ago 00:12:17 3
1_5
2 months ago 00:09:51 1
1_3
2 months ago 00:07:34 1
1_2
2 months ago 00:09:04 1
1_1
2 months ago 00:10:28 1
Забудь метод из СССР! Смотрите как легко делить дроби! Учитель математики решил задание за 5 класс
2 months ago 04:15:07 1
RGG, day 18 добил говно про ученого
2 months ago 00:35:24 1
Как ученые будут продлевать жизнь Путину и его друзьям? Будут ли править Россией дети из бункера?
2 months ago 00:01:44 1
💱 Торговые роботы на заказ ⚫ Forex индикаторы купить ⭐