Этим утром мы с братом обсуждали различие между вероятностью и статистикой за мешком мармеладных мишек (которые, надо признать, гораздо более приятный способ изучения вероятности, чем игра в кости).

Каждый из нас полез в сумку, и в момент космического совпадения он вытащил горсть, в основном зеленых медведей и смесь других цветов, а мне удалось поймать по одному каждого цвета. Естественно, мы оба воскликнули: «Какова вероятность этого?!» Конечно, вероятность выпадения медведя определенного цвета всегда равна 1/5, или 20%, потому что существует 5 возможных цветов, и каждый имеет равные шансы быть выпавшим. Если предположить выборку с заменой, то расчет вероятности будет:

def calculate_probability_of_handful(my_handful) -> float:
    """
    Calculates the probability of the selecting your handful of gummy bears.
    Assumes all gummy bears were selected at the same time and 
    there is a uniform distribution of colors.

    Args:
      my_handful (list[str]): List of the gummy bears in your handful.

    Returns:
      probability    (float): The percent probability of pulling your handful.
    """
    # there is a 1/5 (or 20%) chance of selecting any color bear
    probability = (0.20 ** len(my_handful)) * 100

    return probability


print(calculate_probability_of_handful(my_handful=['red', 'orange', 'yellow', 'green', 'clear']))

Так в чем разница?

Это отличный пример вероятности, потому что мы знаем распределение мармеладных мишек, из которых мы рисуем (равномерное распределение), и хотим рассчитать вероятность определенного результата (получения определенного сочетания цветов). Вот что приводит к умному различию между понятиями вероятности и статистики.

Вероятность: мы знаем источник наших данных и хотим рассчитать результат.

Статистика: мы знаем результат и хотим узнать источник наших данных.

Если бы у нас была горстка мишек и мы ничего не знали об их общем распределении, нам пришлось бы использовать статистику, чтобы узнать о большей популяции мармеладных мишек. Мы могли бы сделать это, используя статистическую модель, например линейную регрессию. Но вот в чем дело: мы никогда не можем быть полностью уверены в своих выводах, потому что имеем дело со случайными результатами. Вот почему мы используем термин статистическая оценка для учета погрешности, присущей нашим предположениям. Каждое понимание, которое мы получаем из статистической модели, считается оценкой, потому что мы пытаемся извлечь информацию из случайных событий. Вот почему мы не говорим о статистических истинах.

Давайте на мгновение отвлечемся от этого эксперимента с мармеладными мишками. В последнем абзаце я представил концепцию изучения базового источника данных. Понятие обучение в машинном обучении является двоюродным братом статистического обучения. В то время как статистическое обучение связано с выводами о населении на основе случайной выборки, машинное обучение больше ориентировано на прогнозы или решения на основе новых, невидимых данных. А если мы знаем и распределение, и исход? Что ж, в этом случае нет необходимости в вероятности или статистике, потому что здесь нет никакой случайности.

Вероятность также поднимает философские вопросы о причинности и детерминизме. Некоторые философы утверждают, что вероятность подрывает идею детерминизма, поскольку предполагает, что события могут происходить случайно и не обязательно являются результатом предшествующих причин. Но это совсем другая сумка с мармеладными мишками.

Понятно, что конфеты — это вкусный и универсальный инструмент для понимания вероятности и статистики. И хотя всегда интересно размышлять о вероятности получить радугу цветов мармеладных мишек из одной горсти, реальная сила вероятности и статистики заключается в их способности помочь нам узнать и понять мир вокруг нас. Просто помните, когда дело доходит до вероятности и статистики, важно сохранять непредубежденность и иметь под рукой пакет мармеладных мишек. Вы никогда не знаете, когда может случиться сахарная лихорадка и внезапное прозрение!

Приятного обучения, мой дорогой читатель!

Надеюсь, вам понравилась эта статья. Если да, пожалуйста, выразите свою признательность, поставив лайк или несколько раз восторженно похлопав (не стесняйтесь хлопать столько раз, сколько хотите, даже 100 раз!). Ваша поддержка очень ценится.

Связаться с Кайли Тейлор

Давай будем друзьями! Вы можете найти меня в LinkedIn.