Skip to content

Instantly share code, notes, and snippets.

Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
@dsibi
dsibi / 1.1 Matplotlib Anathomy
Last active April 12, 2020 14:40
Dataviz in Python_1. Matplotlib Basics
import numpy as np
import matplotlib.pyplot as plt
X = np.linspace(0.5,3.5,100)
Y1 = 3+np.cos(X)
Y2 = 1+np.cos(1+X/0.75)/2
Y3 = np.random.uniform(Y1,Y2,len(X))
fig = plt.figure(figsize=(12,12))
ax = fig.add_subplot(1,1,1)
ax.plot(X,Y1,c="blue",lw=2,label="Первый сигнал")
@dsibi
dsibi / 1-basic_syntax
Last active March 9, 2023 09:24
yandex_python_data_analyst
1. Анализ данных начинается здесь
Мы начнём курс с изучения языка Python — основного инструмента аналитика данных.
Чему вы научитесь
В этой теме вы познакомитесь с основами Python: узнаете, как выводить текст на экран, создавать переменные и выполнять с ними математические операции. Это будет не теоретический рассказ. Прямо по ходу обучения вы будете анализировать реальные данные, и в конце представите небольшой отчёт об исследовании.
Сколько времени это займёт
2,5 часа: 19 уроков примерно по 8 минут.
Постановка задачи
На китайском языке говорят больше миллиарда человек, но много ли сайтов на нём написано? А на русском? Чтобы узнать ответы на эти вопросы, мы рассмотрим данные о распространённости языков в мире и в интернете.
########################################################################################################################
@dsibi
dsibi / 2_lists_and_loops
Last active January 29, 2024 17:22
yandex_python_data_analyst
1. Структурирование и автоматизация
Данные, которые нам предстоит обрабатывать, представлены в виде таблиц. Вы научитесь передавать эти таблицы языку Python, чтобы он мог их менять и анализировать.
Чему вы научитесь
В этой теме вы познакомитесь со структурами данных на примере списков и узнаете, как их обрабатывать циклами. Научитесь создавать таблицы с новой информацией на примере небольшого проекта.
Сколько времени это займёт
3 часа: 15 уроков примерно по 12 минут.
Постановка задачи
Какие эмодзи наиболее популярны в соцсетях? Проанализируем частоту использования эмодзи на разных платформах. Вы сможете сравнить своё поведение с поведением большинства пользователей.
Обратите внимание: мы проводим исследование, результаты которого заранее предсказать невозможно. Только анализ данных позволяет находить ответы на подобные вопросы — ни теория, ни интуиция здесь не выручат.
@dsibi
dsibi / 3_tables
Last active June 22, 2024 10:37
yandex_python_data_analyst
1. Наглядность и лаконичность
Вы будете управлять данными в таблицах и получите новые инструменты для их анализа.
Чему вы научитесь
Сортировать данные в таблицах, добавлять новые столбцы и выбирать интересные строки.
Сколько времени это займёт
2 часа: 11 уроков примерно по 12 минут.
Постановка задачи
Продолжим исследовать употребление эмодзи на разных платформах и установим, какие чувства чаще всего выражают подобными символами. Проверим нашу рабочую гипотезу о преобладании эмодзи, поднимающих настроение.
########################################################################################################################
@dsibi
dsibi / 01. Анализ по группам
Last active January 25, 2023 21:08
yandex_python_data_analyst_4_Условия и функции
Разобьём элементы таблиц на группы и проанализируем их свойства.
Чему вы научитесь
Создавать функции, фильтровать данные и пользоваться условным оператором.
Сколько времени это займёт
4 часа: 17 уроков примерно по 14 минут.
Постановка задачи
Каждый год Американская киноакадемия вручает премию «Оскар» за лучший фильм. Проанализируем фильмы, получившие эту премию за последние 30 лет, и посмотрим, как менялись предпочтения киноакадемии за это время.
@dsibi
dsibi / 1. Анализ данных продолжается здесь
Last active April 15, 2025 15:50
yandex_python_data_analyst_5_Pandas для анализа данных
Данные исследуют в четыре стадии:
Получение данных и ознакомление с ними
Предподготовка данных
Анализ данных
Оформление результатов исследования
В этой теме мы начнём с первой стадии. В получении данных и ознакомлении с ними важную роль выполняет библиотека Pandas.
Чему вы научитесь
Познакомитесь с библиотекой Pandas и её базовыми методами: чтением файла, выводом данных на экран, получением сводной информации и запросом значений из определённых ячеек таблицы.
Сколько времени это займёт
2 часа = 6 уроков от 2 до 30 минут.