This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
#Marker colors | |
fig=px.scatter_geo(df,lon='longitude', | |
lat='latitude',color='bins', | |
opacity=0.5,size='data', | |
projection="natural earth", | |
color_discrete_sequence=px.colors.qualitative.Light24) |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
#In the code below I have marker labels which now is located close to these markers. What is the way to make customise destination between marker and it's label? I want to put labels a little bit far from markers now. | |
import plotly.express as px | |
import plotly.graph_objs as go | |
import pandas as pd | |
rows=[['501-600','15','122.58333','45.36667'], | |
['till 500','4','12.5','27.5'], | |
['more 1001','41','-115.53333','38.08'], | |
] |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Здесь расходятся пути к двум профессиям Яндекс.Практикума — аналитику и специалисту по Data Science. Ничего страшного, если сейчас вы передумаете и переведётесь на другую программу. Вводный курс обеих профессий одинаков. | |
В чём же разница? | |
Аналитик данных исследует «боли» бизнеса и помогает принимать решения. Затем в дело вступают разработчики. Если классических алгоритмов недостаточно, нужно машинное обучение. Это математические модели: они формируют предсказания на основе исторических данных. Тогда нужен специалист по Data Science, который знает и анализ данных, и математику, и машинное обучение. | |
Примеры задач аналитика данных: | |
Ритейл-сеть хочет найти районы с большой плотностью населения и маленьким количеством супермаркетов. | |
Мобильному оператору нужно провести A/B-тестирование двух вариантов текста рекламной рассылки. | |
Интернет-магазину требуется построить дашборд конверсий по источникам трафика. | |
Примеры задач, где нужно машинное обучение: | |
Банк хочет автоматически прогнозировать платёжеспособность клиента. |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Самостоятельный проект — это практическая проверка знаний, приобретённых вами на вводном курсе. Каждый раздел посвящён отдельной стадии анализа данных с экскурсом в основы Python. Ещё эту работу можно добавить в портфолио. Вы начинаете собирать это портфолио прямо сейчас. | |
Проект выполняется в пять этапов: | |
Постановка задачи | |
Получение данных | |
Предобработка данных | |
Анализ данных | |
Оформление результатов | |
Для каждой части описаны шаги выполнения c теоретическим приложением. В Jupyter Notebook эти шаги связаны между собой выводами и результатами. | |
Вы закрепите применение операторов и методов языка Python (и его библиотеки Pandas) на разных стадиях анализа данных. Кроме того, получите первый опыт оформления в Jupyter Notebook проекта, которым можно поделиться. | |
Если возникнут сложности, всегда можно воспользоваться навигацией по пройденным урокам, а также шпаргалками. |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Проект представляет собой единую большую задачу. Он состоит из нескольких заданий и скрытых тестов к ним. Двигаясь от задания к заданию, вы пишете код, выполняете его, оцениваете результат. Последовательно решённые задания соединяются в общий аналитический проект. Прогресс выполнения заданий отображается внизу, на шкале 1 - 2 - … - N. | |
Для упражнения перейдите сейчас в Jupyter Notebook, расположенный справа. Найдите ячейки, относящиеся к заданию 1. Выполните требуемые действия и нажмите Проверить задание (внизу справа), чтобы увидеть, как всё работает. |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Когда данные очищены от мусора, можно приступить к самому интересному — расчётам и презентации результатов заказчику. | |
Чему вы научитесь | |
Принципам группировки и сортировки данных, расчёту статистики и формированию наглядного отчёта об исследовании. | |
Сколько времени это займёт | |
1,5 часа = 5 уроков от 1 до 25 минут. | |
Постановка задачи | |
Завершаем анализ данных Яндекс.Музыки, выполняем поставленную менеджером задачу и сдаём отчёт. |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Предобработке данных аналитик посвящает массу времени: иначе удовлетворительное решение поставленной задачи неосуществимо. | |
Чему вы научитесь | |
Познакомитесь с распространёнными видами «мусора в данных» и специальными методами Pandas для борьбы с ним. | |
Сколько времени это займёт | |
2 часа = 5 уроков от 2 до 30 минут. | |
Постановка задачи | |
Продолжаем работать с данными Яндекс.Музыки — оцениваем качество данных и повышаем его до готовности к анализу. |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Данные исследуют в четыре стадии: | |
Получение данных и ознакомление с ними | |
Предподготовка данных | |
Анализ данных | |
Оформление результатов исследования | |
В этой теме мы начнём с первой стадии. В получении данных и ознакомлении с ними важную роль выполняет библиотека Pandas. | |
Чему вы научитесь | |
Познакомитесь с библиотекой Pandas и её базовыми методами: чтением файла, выводом данных на экран, получением сводной информации и запросом значений из определённых ячеек таблицы. | |
Сколько времени это займёт | |
2 часа = 6 уроков от 2 до 30 минут. |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Разобьём элементы таблиц на группы и проанализируем их свойства. | |
Чему вы научитесь | |
Создавать функции, фильтровать данные и пользоваться условным оператором. | |
Сколько времени это займёт | |
4 часа: 17 уроков примерно по 14 минут. | |
Постановка задачи | |
Каждый год Американская киноакадемия вручает премию «Оскар» за лучший фильм. Проанализируем фильмы, получившие эту премию за последние 30 лет, и посмотрим, как менялись предпочтения киноакадемии за это время. |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
1. Наглядность и лаконичность | |
Вы будете управлять данными в таблицах и получите новые инструменты для их анализа. | |
Чему вы научитесь | |
Сортировать данные в таблицах, добавлять новые столбцы и выбирать интересные строки. | |
Сколько времени это займёт | |
2 часа: 11 уроков примерно по 12 минут. | |
Постановка задачи | |
Продолжим исследовать употребление эмодзи на разных платформах и установим, какие чувства чаще всего выражают подобными символами. Проверим нашу рабочую гипотезу о преобладании эмодзи, поднимающих настроение. | |
######################################################################################################################## |