В 5Fathom мы тратим много времени на сбор больших наборов данных (>1 ТБ). Десятилетия перестраховочного портфеля, убытков, рисков (EDM) и данных о погоде — все для принятия обоснованных бизнес-решений для наших клиентов. Разрешение данных (и, следовательно, объем) от поставщиков моделей CAT становится все богаче с каждым кварталом. Качество, новые источники данных появляются невероятными темпами. Если взять в качестве примера погоду, уровень разнообразных наборов данных, доступных для всех категорий опасностей и погодных условий, поразителен:

  • IBM TWC имеет сеть из более чем 230 000 наземных станций наблюдения по всему миру, записывающих данные о погоде с шагом 15 минут.
  • IBM и их партнеры теперь предлагают глобальные наборы данных с координатной сеткой, содержащие точные исторические данные о погоде начиная с 1979 года.
  • NOAA имеет 1356 буев, работающих в Мировом океане, которые передают данные каждые 15 минут.
  • Коммерческие самолеты в настоящее время обеспечивают более 130 000 метеорологических наблюдений в день, включая температуру, ветер и, в некоторых случаях, влажность, вертикальные порывы ветра или скорость рассеивания вихрей (турбулентность).
  • XM Sirius, NOAA и другие сообщают данные о погоде со своих сетей геостационарных спутников каждые 12 минут.
  • И считаю…

Хотя эти данные абсолютно ценны и необходимы в области перестрахования (проверка модели, моделирование рисков локализованных событий, урегулирование претензий и т. д.), они также создают новые проблемы. Прием данных, их проверка, манипулирование, форматирование — все стандартные задачи, которые необходимо выполнить, прежде чем вы сможете начать извлекать ценную информацию из данных. Это утомительная и трудоемкая работа.

В 5Fathom нам нужно было найти лучший способ. Нашими проблемами были масштаб и скорость. Нам нужно было увеличить пропускную способность нашей команды для обработки нескольких одновременных запросов. Нам также нужно было увеличить скорость, с которой мы могли обобщать важные тенденции и другие выводы из данных для наших клиентов.

Введите IBM Watson Analytics.

Имейте в виду, что все эти сведения были предоставлены, когда вы не касались клавиатуры.

Чтобы дать вам представление о ценности, которую 5Fathom получает от Watson, я покажу вам реальный пример того, как мы используем этот сервис.

Набор данных, который мы изучали, состоял из данных об осадках за 67 лет со станции METAR муниципального аэропорта Ватерлоо с ежедневным разрешением. Данные были отформатированы как файл со значениями, разделенными запятыми (CSV), и имели размер 915 КБ. Заголовки столбцов были:

  • Год
  • Месяц
  • День
  • Максимальное количество осадков (см/час)
  • Сумма осадков (см/час)

После загрузки CSV-файла в Watson Watson немедленно ищет тренды, корреляции и другие статистические данные в данных. Это просто, но мощно, потому что это делается автоматически для вас.

Каждая из этих идей сопровождается интерактивными диаграммами и визуализациями:

Помимо информации, которую Watson находит самостоятельно, вы можете задать Watson на простом английском языке свои вопросы о ваших данных. Например, если бы я хотел узнать, в какой день месяца за 38 лет выпадает наименьшее количество осадков, я мог бы спросить "Как соотносятся максимальные осадки по дням?"

Watson автоматически понимает, что я ищу, и предоставляет мне как сравнение, так и анализ тенденций в соответствии с моим запросом.

Итак, игнорируя 31-е число месяца (поскольку только 7 месяцев в году имеют 31 день), похоже, что 7-й день месяца — ваш лучший выбор для активного отдыха в этом месте.

Чтобы еще больше подчеркнуть ценность этих выводов, взгляните на выводы по умолчанию, предложенные Watson, когда я вычислил исторические значения скорости ветра (средняя/макс.) для предстоящего Кубка Америки на Бермудских островах:

Хотя эти примеры довольно упрощены, вы уже должны иметь представление о некоторых возможностях Watson. Имейте в виду, что все эти сведения были предоставлены без использования клавиатуры.

Мы даже не начали использовать возможности прогнозирования или визуализации/презентации Watson. Это будет в следующих статьях.

Я не могу не отметить, насколько быстр этот сервис и насколько он прост в использовании. Мы только начинаем использовать IBM Watson Analytics, но я уже вижу, насколько важной будет эта технология для нашего бизнеса.

Напишите нам, если хотите узнать больше.