Разница между вероятностью и статистикой

Этим утром мы с братом обсуждали различие между вероятностью и статистикой за мешком мармеладных мишек (которые, надо признать, гораздо более приятный способ изучения вероятности, чем игра в кости).

Каждый из нас полез в сумку, и в момент космического совпадения он вытащил горсть, в основном зеленых медведей и смесь других цветов, а мне удалось поймать по одному каждого цвета. Естественно, мы оба воскликнули: «Какова вероятность этого?!» Конечно, вероятность выпадения медведя определенного цвета всегда равна 1/5, или 20%, потому что существует 5 возможных цветов, и каждый имеет равные шансы быть выпавшим. Если предположить выборку с заменой, то расчет вероятности будет:

def calculate_probability_of_handful(my_handful) -> float:
    """
    Calculates the probability of the selecting your handful of gummy bears.
    Assumes all gummy bears were selected at the same time and 
    there is a uniform distribution of colors.

    Args:
      my_handful (list[str]): List of the gummy bears in your handful.

    Returns:
      probability    (float): The percent probability of pulling your handful.
    """
    # there is a 1/5 (or 20%) chance of selecting any color bear
    probability = (0.20 ** len(my_handful)) * 100

    return probability


print(calculate_probability_of_handful(my_handful=['red', 'orange', 'yellow', 'green', 'clear']))

Так в чем разница?

Это отличный пример вероятности, потому что мы знаем распределение мармеладных мишек, из которых мы рисуем (равномерное распределение), и хотим рассчитать вероятность определенного результата (получения определенного сочетания цветов). Вот что приводит к умному различию между понятиями вероятности и статистики.

Вероятность: мы знаем источник наших данных и хотим рассчитать результат.

Статистика: мы знаем результат и хотим узнать источник наших данных.

Если бы у нас была горстка мишек и мы ничего не знали об их общем распределении, нам пришлось бы использовать статистику, чтобы узнать о большей популяции мармеладных мишек. Мы могли бы сделать это, используя статистическую модель, например линейную регрессию. Но вот в чем дело: мы никогда не можем быть полностью уверены в своих выводах, потому что имеем дело со случайными результатами. Вот почему мы используем термин статистическая оценка для учета погрешности, присущей нашим предположениям. Каждое понимание, которое мы получаем из статистической модели, считается оценкой, потому что мы пытаемся извлечь информацию из случайных событий. Вот почему мы не говорим о статистических истинах.

Давайте на мгновение отвлечемся от этого эксперимента с мармеладными мишками. В последнем абзаце я представил концепцию изучения базового источника данных. Понятие обучение в машинном обучении является двоюродным братом статистического обучения. В то время как статистическое обучение связано с выводами о населении на основе случайной выборки, машинное обучение больше ориентировано на прогнозы или решения на основе новых, невидимых данных. А если мы знаем и распределение, и исход? Что ж, в этом случае нет необходимости в вероятности или статистике, потому что здесь нет никакой случайности.

Вероятность также поднимает философские вопросы о причинности и детерминизме. Некоторые философы утверждают, что вероятность подрывает идею детерминизма, поскольку предполагает, что события могут происходить случайно и не обязательно являются результатом предшествующих причин. Но это совсем другая сумка с мармеладными мишками.

Понятно, что конфеты — это вкусный и универсальный инструмент для понимания вероятности и статистики. И хотя всегда интересно размышлять о вероятности получить радугу цветов мармеладных мишек из одной горсти, реальная сила вероятности и статистики заключается в их способности помочь нам узнать и понять мир вокруг нас. Просто помните, когда дело доходит до вероятности и статистики, важно сохранять непредубежденность и иметь под рукой пакет мармеладных мишек. Вы никогда не знаете, когда может случиться сахарная лихорадка и внезапное прозрение!

Приятного обучения, мой дорогой читатель!

Надеюсь, вам понравилась эта статья. Если да, пожалуйста, выразите свою признательность, поставив лайк или несколько раз восторженно похлопав (не стесняйтесь хлопать столько раз, сколько хотите, даже 100 раз!). Ваша поддержка очень ценится.

Связаться с Кайли Тейлор

Давай будем друзьями! Вы можете найти меня в LinkedIn.

Новые материалы

ИИ для общего блага, часть вторая

В нашем последнем блоге мы исследовали возможности ИИ для общего блага, указав на несколько инициатив по поиску действенных решений для продвижения справедливых и беспристрастных систем ИИ. По..

Время расцвета закончилось

Большую часть своей карьеры в индустрии программного обеспечения программисты работали с головой в песок. Успех в отрасли требует навыков презентации и обучения других. Ценность улучшенных..

Будущее сельского хозяйства: новый уровень производительности с современными технологиями

По мере роста населения мира растет и спрос на продукты питания. Фермеры сталкиваются с растущим давлением необходимости повышать урожайность и максимизировать производительность, манипулируя..

Состояние совместной фильтрации в 2022 году, часть 1

ResBeMF: Улучшение прогнозируемого охвата совместной фильтрации на основе классификации (arXiv) Автор: Анхель Гонсалес-Прието , Авраам Гутьеррес , Фернандо Ортега , Рауль Лара-Кабрера..

Зачем изучать PYTHON в 2022 году !

Python — востребованный, доступный язык программирования с активным, постоянно растущим сообществом пользователей. Для тех, кто хочет сменить профессию в мире технологий с помощью..

Решение капч с помощью Puppeteer

Это руководство предназначено для текстовых кодов, а не для reCAPTCHA Google (см. конец этого сообщения). Требования: Антикапча или любой другой сервис по разгадыванию капчи. Модуль..

7 встроенных библиотек Python, которые необходимо знать

7 встроенных библиотек Python, которые необходимо знать Стандартная библиотека Python значительно упрощает жизнь программистов, предоставляя широкий набор функций. Мы выбираем несколько..

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Web Development Python Coding Deep Learning AI Software Engineering React Java Nodejs Front End Development Development Algorithms Typescript Tech Programming Languages Data Computer Science Reactjs NLP Learning Javascript Tips HTML CSS Computer Vision Code Productivity Golang Tutorial Neural Networks Startup ChatGPT Statistics Angular