В этом проекте проанализирован датасет о контенте на платформе Netflix. Этот анализ помог понять структуру каталога видеоплатформы, а также какие материалы и в каком количестве хранятся на видеоплатформе по жанрам, длительности и другим параметрам.
Предварительная работа - подготовка данных для создания визуализаций
Сначала загружаю в блокнот датасет с Kaggle через kagglehub
Затем делаю предобработку (очистка, парсинг данных для более удобной визулизации в дальнейшем) и описательную статистику, чтобы можно сделать минимальные выводы
График 1 — динамика добавления контента в Netflix
Первый график отображает динамику добавления контента, из которого мы видим, что бурный рост контента пришелся на 2016–2019 год, после чего произошел небольшой спад
График 2 — Bar chart: фильмы vs сериалы
График 2 показывает, что фильмов на видеоплатформе практически в 2 раза больше, чем сериалов
График 3 — Bar chart (Top-10): страны-лидеры
В этом графике видим, что лидирующая страна по публикации контента — США, а последние место занимает Мексика
График 4 — Histogram: распределение длительности фильмов (в минутах)
Эта гистограмма показывает, что наибольшее количество фильмов длится 90-100 минут, а контент, который длится больше 200 минут меньше 10 штук на всей платформе
График 5 — Boxplot: длительность фильмов по возрастному рейтингу
В этом графике видно, что большая часть контента вне зависимости от возраста все равно находится в диапазоне около 100 минут, и сильного различия по длительности для определенных групп зрителей не наблюдается, только для последней группы TV-Y (контент, подходящий для детей 2-5 лет) закономерно чуть меньше по длительности
График 6 — Bar chart (Top-10): жанры-лидеры
Несмотря на популярность Netflix за счет сериалов, в этом графике видно, что больше всего контента на платформе занимают полнометражные фильмы



















