Исходный размер 1140x1600

Самое жизнерадостное исследование по нейросетям

Вводная часть: осторожно, черный юмор!

Поскольку я студентка вышки, выбор, какие данные анализировать, был очевиден: конечно же статистику самоубийств. В Китае. Почему именно там? Потому что азиаты известны своим трудолюбием и жесткой конкуренцией (в сфере образования в том числе), а мне в период сессии жизненно необходимо знать, что кому-то живется хуже, чем мне. Ну или же уже не живется…

Все статистики я брала с сайта «Kaggle», поскольку он:

  1. Был рекомендован преподавателем и составителем курса, а значит безопасен и надежен.
  2. Содержит подозрительно много датасетов на тему самоубийств. Видимо, его пользователи в этой теме разбираются.

В работе были использованы:

  1. Круговые диаграммы, чтобы нагляднее показать соотношение малого количества параметров
  2. График с маркерами, для лучшего сопоставления по датам
  3. Вертикальные гистограммы, для наглядного сопоставления большого количества параметров

Этапы работы

  1. Определиться с темой исследования и сайтом с источниками информации. Скачать датасет. 15 минут пытаться запихнуть его в юпитер, сдаться, спросить у чата гпт, как это сделать. Все-таки запихнуть его в юпитер.

  2. Выбрать, какие столбцы нужно анализировать, и по какому принципу. 20 минут упираться в одну ошибку при проигрывании кода, сдаться, спросить у чата гпт что не так. Выяснить, что ты слепой дундук, пропустивший букву в названии файла. Написать код без обращения на цвет получаемых графиков.

Исходный размер 722x333
  1. Сделать все графики. Выбрать подходящие для них цвета: в моем случае я решила взять синий и розовый (разделение по полу и стереотипы, тыры-пыры) и 4 цвета в одном из графиков, которые ассоциируются с временами года, поскольку он отражал статистику по месяцам.

3.1 Залезть на сайт matplotlib за инструкцией по смене цвета, узнать много нового (например, что у них существует библиотека основных цветов)

Исходный размер 1504x888

3.2 …даже с инструкцией ничего не понять, пойти к чату гпт за советом

Исходный размер 1108x416
  1. Переделать код с нужными цветами.
Исходный размер 770x385
  1. Профит, вы восхитительны!
Исходный размер 846x689

Разделение самоубийц по полу

Исходный размер 654x388
Исходный размер 803x730

Статистика удачных самоубийств — сравнение данных одного столбца

Исходный размер 879x451
Исходный размер 932x595

Зависимость смертности от госпитализации — сравнение взаимосвязи данных двух столбцов. Какие выводы можно сделать? Все, кто не умер, и не был в больнице, в статистике не участвуют.

Исходный размер 720x506
Исходный размер 1134x616

Упорядоченные данные из одного столбца. Выводы: дети в статистике не участвуют, старики после 100 в любом случае списываются в естественную смерть.

Исходный размер 741x678
Исходный размер 1238x667

Упорядоченные данные одного столбца. Выводы? В новый год либо больницы не работают, либо все жить хотят.

Исходный размер 811x464
Исходный размер 1267x691

Сопоставление данных из двух столбцов и их сравнение. Выводов нет, шутку придумайте сами (главное не про башни)

Исходный размер 929x503
Исходный размер 1087x595

Сопоставление данных из двух столбцов и их упорядоченность. Выводы? Тонуть эффективно. Но это исследование, а не инструкция, так что все равно не стоит.

Чем пользовалась при исследовании:

  1. https://gpt-chatbot.ru/ — бесплатный чат гпт на русском, дата обращения 22.06.2024. Использовался для помощи в трудные моменты
  2. https://pandas.pydata.org/getting_started.html — инструкция по установке с сайта pandas, дата обращения 22.06.2024.
  3. https://matplotlib.org/stable/users/explain/colors/colors.html — сайт matplotlib, дата обращения 22.06.2024.
  4. https://www.kaggle.com/datasets/utkarshx27/suicide-attempts-in-shandong-china — сайт kaggle, конкретно вот этот датасет. Дата обращения 22.06.2024.
  5. Обложка была сфотошоплена из картинок с сайта www.google.com, дата обращения 22.06.2024.
  6. https://jupyter.org/ — Jupiter Notebook, дата обращения 22.06.2024. (только я его из Anaconda запускала)
Самое жизнерадостное исследование по нейросетям
Проект создан 25.09.2024
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше