Skip to content

Instantly share code, notes, and snippets.

@dsibi
dsibi / Marker colors.py
Last active May 22, 2020 06:17
Meteors
#Marker colors
fig=px.scatter_geo(df,lon='longitude',
lat='latitude',color='bins',
opacity=0.5,size='data',
projection="natural earth",
color_discrete_sequence=px.colors.qualitative.Light24)
@dsibi
dsibi / Labels align.py
Last active May 22, 2020 06:16
Meteors
#In the code below I have marker labels which now is located close to these markers. What is the way to make customise destination between marker and it's label? I want to put labels a little bit far from markers now.
import plotly.express as px
import plotly.graph_objs as go
import pandas as pd
rows=[['501-600','15','122.58333','45.36667'],
['till 500','4','12.5','27.5'],
['more 1001','41','-115.53333','38.08'],
]
@dsibi
dsibi / 1. Разница между профессиями
Created April 11, 2020 19:21
yandex_python_data_analyst_10_Выбор профессии
Здесь расходятся пути к двум профессиям Яндекс.Практикума — аналитику и специалисту по Data Science. Ничего страшного, если сейчас вы передумаете и переведётесь на другую программу. Вводный курс обеих профессий одинаков.
В чём же разница?
Аналитик данных исследует «боли» бизнеса и помогает принимать решения. Затем в дело вступают разработчики. Если классических алгоритмов недостаточно, нужно машинное обучение. Это математические модели: они формируют предсказания на основе исторических данных. Тогда нужен специалист по Data Science, который знает и анализ данных, и математику, и машинное обучение.
Примеры задач аналитика данных:
Ритейл-сеть хочет найти районы с большой плотностью населения и маленьким количеством супермаркетов.
Мобильному оператору нужно провести A/B-тестирование двух вариантов текста рекламной рассылки.
Интернет-магазину требуется построить дашборд конверсий по источникам трафика.
Примеры задач, где нужно машинное обучение:
Банк хочет автоматически прогнозировать платёжеспособность клиента.
@dsibi
dsibi / Добро пожаловать в самостоятельный проект
Last active February 11, 2024 15:37
yandex_python_data_analyst_9_Самостоятельный проект: Музыка
Самостоятельный проект — это практическая проверка знаний, приобретённых вами на вводном курсе. Каждый раздел посвящён отдельной стадии анализа данных с экскурсом в основы Python. Ещё эту работу можно добавить в портфолио. Вы начинаете собирать это портфолио прямо сейчас.
Проект выполняется в пять этапов:
Постановка задачи
Получение данных
Предобработка данных
Анализ данных
Оформление результатов
Для каждой части описаны шаги выполнения c теоретическим приложением. В Jupyter Notebook эти шаги связаны между собой выводами и результатами.
Вы закрепите применение операторов и методов языка Python (и его библиотеки Pandas) на разных стадиях анализа данных. Кроме того, получите первый опыт оформления в Jupyter Notebook проекта, которым можно поделиться.
Если возникнут сложности, всегда можно воспользоваться навигацией по пройденным урокам, а также шпаргалками.
@dsibi
dsibi / Задание 1. Что такое проекты в Jupyter
Last active April 11, 2020 09:43
yandex_python_data_analyst_8_Используем Jupyter Notebook
Проект представляет собой единую большую задачу. Он состоит из нескольких заданий и скрытых тестов к ним. Двигаясь от задания к заданию, вы пишете код, выполняете его, оцениваете результат. Последовательно решённые задания соединяются в общий аналитический проект. Прогресс выполнения заданий отображается внизу, на шкале 1 - 2 - … - N.
Для упражнения перейдите сейчас в Jupyter Notebook, расположенный справа. Найдите ячейки, относящиеся к заданию 1. Выполните требуемые действия и нажмите Проверить задание (внизу справа), чтобы увидеть, как всё работает.
@dsibi
dsibi / 1. Принимаемся за статистику
Last active March 12, 2025 07:51
yandex_python_data_analyst_7_Анализ данных и оформление результатов
Когда данные очищены от мусора, можно приступить к самому интересному — расчётам и презентации результатов заказчику.
Чему вы научитесь
Принципам группировки и сортировки данных, расчёту статистики и формированию наглядного отчёта об исследовании.
Сколько времени это займёт
1,5 часа = 5 уроков от 1 до 25 минут.
Постановка задачи
Завершаем анализ данных Яндекс.Музыки, выполняем поставленную менеджером задачу и сдаём отчёт.
@dsibi
dsibi / 1. Раздельный сбор информационного мусора
Last active May 7, 2024 06:16
yandex_python_data_analyst_6_Предобработка данных
Предобработке данных аналитик посвящает массу времени: иначе удовлетворительное решение поставленной задачи неосуществимо.
Чему вы научитесь
Познакомитесь с распространёнными видами «мусора в данных» и специальными методами Pandas для борьбы с ним.
Сколько времени это займёт
2 часа = 5 уроков от 2 до 30 минут.
Постановка задачи
Продолжаем работать с данными Яндекс.Музыки — оцениваем качество данных и повышаем его до готовности к анализу.
@dsibi
dsibi / 1. Анализ данных продолжается здесь
Last active April 15, 2025 15:50
yandex_python_data_analyst_5_Pandas для анализа данных
Данные исследуют в четыре стадии:
Получение данных и ознакомление с ними
Предподготовка данных
Анализ данных
Оформление результатов исследования
В этой теме мы начнём с первой стадии. В получении данных и ознакомлении с ними важную роль выполняет библиотека Pandas.
Чему вы научитесь
Познакомитесь с библиотекой Pandas и её базовыми методами: чтением файла, выводом данных на экран, получением сводной информации и запросом значений из определённых ячеек таблицы.
Сколько времени это займёт
2 часа = 6 уроков от 2 до 30 минут.
@dsibi
dsibi / 01. Анализ по группам
Last active January 25, 2023 21:08
yandex_python_data_analyst_4_Условия и функции
Разобьём элементы таблиц на группы и проанализируем их свойства.
Чему вы научитесь
Создавать функции, фильтровать данные и пользоваться условным оператором.
Сколько времени это займёт
4 часа: 17 уроков примерно по 14 минут.
Постановка задачи
Каждый год Американская киноакадемия вручает премию «Оскар» за лучший фильм. Проанализируем фильмы, получившие эту премию за последние 30 лет, и посмотрим, как менялись предпочтения киноакадемии за это время.
@dsibi
dsibi / 3_tables
Last active June 22, 2024 10:37
yandex_python_data_analyst
1. Наглядность и лаконичность
Вы будете управлять данными в таблицах и получите новые инструменты для их анализа.
Чему вы научитесь
Сортировать данные в таблицах, добавлять новые столбцы и выбирать интересные строки.
Сколько времени это займёт
2 часа: 11 уроков примерно по 12 минут.
Постановка задачи
Продолжим исследовать употребление эмодзи на разных платформах и установим, какие чувства чаще всего выражают подобными символами. Проверим нашу рабочую гипотезу о преобладании эмодзи, поднимающих настроение.
########################################################################################################################