Ключевые концепции науки о данных объясняются примерами.

Будучи специалистом по данным, вы постоянно работаете с данными и логикой. В этом руководстве будут рассмотрены концепции, которые облегчат решение задач, связанных с данными.

1. Как импортировать данные в Python

Чтобы иметь возможность работать с данными, их необходимо импортировать. Данные могут поступать из различных источников, например, из Интернета, баз данных и т. д. Большая часть данных будет доступна в файлах CSV. Предположим, у вас есть CSV-файл с именем student.csv; как вы импортируете его в свои скрипты Python?

Библиотека Pandas предоставляет простой и эффективный способ импорта файлов CSV. Давайте загрузим данные в кадр данных pandas:

import pandas as pd
data = pd.read_csv('students.csv')

После того, как вы импортируете данные, вы можете просмотреть более подробную информацию. Например, для просмотра первых 10 строк.

data.head()

Вывод кода выше:

2. Булевы операторы

Наиболее распространенные логические операторы:

  • and используется
  • not используется
  • or используется

Начнем с оператора and.

Давайте используем оператор и для двух выражений:

x =25 
22 < x and x > 20

Приведенный выше код объединяет 2 выражения, и на выходе будет:

True

Давайте посмотрим на другой пример с использованием оператора or. Оператор или всегда приводит к True, если только вы не сравните False или False. Посмотрите на изображение ниже:

Предположим, у вас есть следующее выражение:

x= 60
x < 70 or x > 50

x >70 будет оцениваться как True, в то время как x > 50 также будет оцениваться как True. Результат True or True будет:

True

Теперь давайте посмотрим на оператор not. Оператор not следует следующим соглашениям:

3. Операторы сравнения

Как следует из названия, операторы сравнения используются для сравнения значений Python. Когда мы говорим об операторах сравнения, это операторы.

Операторы могут применяться как к числовым операциям, так и к строкам. Например:

20 > 30
# False
40 <= 50
# True
"Python" =="python"
# False

Давайте воспользуемся оператором != .

# is -25 the same as 25
-25 != 25

Вывод будет:

True

4 . Поток управления

Наиболее часто используемым потоком управления в Python является if elif else statement, используемый для написания программ с условиями.

Предположим, вы работаете с набором данных с группой людей и хотите сгруппировать их по росту; первое условие – проверить, не превышает ли их рост 160 см.

if height < = 160:
   print('short person')

Нам также нужно напечатать что-то еще, если возраст не удовлетворяет вышеуказанному условию. Добавим оператор else.

Что, если мы также хотим удовлетворить еще одно условие? Давайте добавим оператор elif, который печатает «высокий человек», если рост человека больше 180 см. Давайте добавим в код оператор elif.

Протестируем код со значением 170 см.

Результат будет:

person is of average height

5. Петли

Наиболее часто используемый цикл в Python — это цикл for. Циклы помогают перебирать несколько структур данных, таких как словари, списки и кадры данных pandas.
Предположим, у нас есть данные о самых кассовых фильмах 2022 года, полученные путем парсинга в Интернете.

movies =[
 'Doctor Strange in the Multiverse of Madness',
 'The Batman',
 'Top Gun: Maverick',
 'Sonic the Hedgehog 2',
 'Uncharted',
 'The Lost City',
 'Fantastic Beasts: The Secrets of Dumbledore',
 'The Bad Guys',
 'Scream',
 'Morbius']

Фильмы были отобраны на основе рейтинга; давайте воспользуемся циклом for для вывода фильма и его положения.

for index, value in enumerate(movies,1):
    print (index, ",",value)

Вывод будет:

1 , Doctor Strange in the Multiverse of Madness
2 , The Batman
3 , Top Gun: Maverick
4 , Sonic the Hedgehog 2
5 , Uncharted
6 , The Lost City
7 , Fantastic Beasts: The Secrets of Dumbledore
8 , The Bad Guys
9 , Scream
10 , Morbius

Заключение

В этом учебном пособии рассмотрено большинство концепций, которые вы будете ежедневно использовать в своих приложениях по обработке и анализу данных. Если вам понравилось это, вы могли бы также наслаждаться этим?



Дополнительные материалы на PlainEnglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Подпишитесь на нас в Twitter и LinkedIn. Посетите наш Community Discord и присоединитесь к нашему Коллективу талантов.