Ключевые концепции науки о данных объясняются примерами.
Будучи специалистом по данным, вы постоянно работаете с данными и логикой. В этом руководстве будут рассмотрены концепции, которые облегчат решение задач, связанных с данными.
1. Как импортировать данные в Python
Чтобы иметь возможность работать с данными, их необходимо импортировать. Данные могут поступать из различных источников, например, из Интернета, баз данных и т. д. Большая часть данных будет доступна в файлах CSV. Предположим, у вас есть CSV-файл с именем student.csv; как вы импортируете его в свои скрипты Python?
Библиотека Pandas предоставляет простой и эффективный способ импорта файлов CSV. Давайте загрузим данные в кадр данных pandas:
import pandas as pd data = pd.read_csv('students.csv')
После того, как вы импортируете данные, вы можете просмотреть более подробную информацию. Например, для просмотра первых 10 строк.
data.head()
Вывод кода выше:
2. Булевы операторы
Наиболее распространенные логические операторы:
and
используетсяnot
используетсяor
используется
Начнем с оператора and
.
Давайте используем оператор и для двух выражений:
x =25 22 < x and x > 20
Приведенный выше код объединяет 2 выражения, и на выходе будет:
True
Давайте посмотрим на другой пример с использованием оператора or. Оператор или всегда приводит к True, если только вы не сравните False или False. Посмотрите на изображение ниже:
Предположим, у вас есть следующее выражение:
x= 60 x < 70 or x > 50
x >70
будет оцениваться как True
, в то время как x > 50
также будет оцениваться как True
. Результат True or True
будет:
True
Теперь давайте посмотрим на оператор not
. Оператор not
следует следующим соглашениям:
3. Операторы сравнения
Как следует из названия, операторы сравнения используются для сравнения значений Python. Когда мы говорим об операторах сравнения, это операторы.
Операторы могут применяться как к числовым операциям, так и к строкам. Например:
20 > 30 # False 40 <= 50 # True "Python" =="python" # False
Давайте воспользуемся оператором !=
.
# is -25 the same as 25 -25 != 25
Вывод будет:
True
4 . Поток управления
Наиболее часто используемым потоком управления в Python является if elif else
statement, используемый для написания программ с условиями.
Предположим, вы работаете с набором данных с группой людей и хотите сгруппировать их по росту; первое условие – проверить, не превышает ли их рост 160 см.
if height < = 160: print('short person')
Нам также нужно напечатать что-то еще, если возраст не удовлетворяет вышеуказанному условию. Добавим оператор else.
Что, если мы также хотим удовлетворить еще одно условие? Давайте добавим оператор elif
, который печатает «высокий человек», если рост человека больше 180 см. Давайте добавим в код оператор elif
.
Протестируем код со значением 170 см.
Результат будет:
person is of average height
5. Петли
Наиболее часто используемый цикл в Python — это цикл for. Циклы помогают перебирать несколько структур данных, таких как словари, списки и кадры данных pandas.
Предположим, у нас есть данные о самых кассовых фильмах 2022 года, полученные путем парсинга в Интернете.
movies =[ 'Doctor Strange in the Multiverse of Madness', 'The Batman', 'Top Gun: Maverick', 'Sonic the Hedgehog 2', 'Uncharted', 'The Lost City', 'Fantastic Beasts: The Secrets of Dumbledore', 'The Bad Guys', 'Scream', 'Morbius']
Фильмы были отобраны на основе рейтинга; давайте воспользуемся циклом for для вывода фильма и его положения.
for index, value in enumerate(movies,1): print (index, ",",value)
Вывод будет:
1 , Doctor Strange in the Multiverse of Madness 2 , The Batman 3 , Top Gun: Maverick 4 , Sonic the Hedgehog 2 5 , Uncharted 6 , The Lost City 7 , Fantastic Beasts: The Secrets of Dumbledore 8 , The Bad Guys 9 , Scream 10 , Morbius
Заключение
В этом учебном пособии рассмотрено большинство концепций, которые вы будете ежедневно использовать в своих приложениях по обработке и анализу данных. Если вам понравилось это, вы могли бы также наслаждаться этим?
Дополнительные материалы на PlainEnglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Подпишитесь на нас в Twitter и LinkedIn. Посетите наш Community Discord и присоединитесь к нашему Коллективу талантов.