eConti - программирование в вопросах и ответах

Публикации по теме 'data'


Разработка функций для машинного обучения: пошаговое руководство (часть 2)
"Данные будут говорить с вами, если вы готовы их слушать" 👩‍🔬 Исследователи данных, соберитесь! 💻 Наконец-то мы подошли ко второй части нашей серии по разработке функций. У-у-у!🎉 Во второй части📋 мы обсудим извлечение признаков 💡. Но прежде чем мы углубимся в это, нам нужно поговорить о проклятии размерности 😱. Проклятие размерности - настоящая головняк🙆‍♀️. Это как пытаться найти своего друга в переполненной комнате🏃. Чем больше людей, тем сложнее их найти. То же самое..

Подготовьте данные для своих моделей машинного обучения самым быстрым и простым способом с помощью Amazon SageMaker Data Wrangler…
Резюме Amazon SageMaker Data Wrangler - это новая услуга, анонсированная еще в декабре 2020 года и направленная на упрощение процесса подготовки данных и разработки функций для машинного обучения. Вы можете использовать визуальный интерфейс инструмента для построения конвейеров предварительной обработки и визуализации (или потоков, как их называют). Когда будете готовы, экспортируйте потоки в коде и запускайте где угодно! Он также поставляется с интеграцией для других сервисов..

Качество важнее количества
Если бы вы спросили меня несколько лет назад, я бы тоже легко предположил, что системы не могут «лгать», сообщая метрики или счетчики. Самой сложной частью получения информации обычно был процесс ее сбора. То, были ли эти данные точными, никогда не вызывало сомнений. Как и многие размышления, легко оглянуться назад и увидеть, насколько неправильным на самом деле был тот или иной взгляд. Системы не всегда говорят правду, и это не их вина. Одним из основных направлений деятельности..

Исследовательские работы о разработках в области самоконтролируемого обучения, часть 2 (искусственный интеллект)
О сложности защиты самоконтролируемого обучения от извлечения модели ( arXiv ) Автор: Адам Дзидзич , Никита Дхаван , Мухаммад Ахмад Калим , Джонас Гуан , Николас Папернот Аннотация . Самоконтролируемое обучение (SSL) — это все более популярная парадигма машинного обучения, которая обучает модели преобразовывать сложные входные данные в представления, не полагаясь на явные метки. Эти представления кодируют структуры подобия, которые позволяют эффективно изучать несколько..

Понимание ДАННЫХ
Я, Руши Праджапати, приветствую вас в моем еще одном блоге из серии Упрощение , в которой я пытаюсь объяснить сложные темы, упрощая их. В этой серии я написал пять блогов: Компьютерное зрение , ML-DL , Нейронные сети , Функции активации и на тему данные в новой нефти . И сегодня я представляю вам еще один блог о данных, специфичных для науки о данных. В науке о данных данные относятся к необработанным фактам, наблюдениям, измерениям или записям, собранным о людях, событиях или..

Глубокое погружение в наборы данных и фреймы данных Spark с использованием Scala
Полное руководство по наборам данных и фреймам данных Spark Предварительный Apache Spar k - это движок распределенной обработки данных с открытым исходным кодом, который можно использовать для анализа больших данных. Он имеет встроенные библиотеки для потоковой передачи, обработки графиков и машинного обучения, а специалисты по обработке данных могут использовать Spark для быстрого анализа данных в любом масштабе. Языки программирования, поддерживаемые Spark, включают Python,..

Миллионы данных, миллионы путей с возможностями.
В то время, когда новые приложения новых технологий открываются каждый день и непонятно, где и как начать учиться на них, легко почувствовать себя подавленным и избежать текущей необходимости хотя бы понять, как они работают и как мы можем их использовать. . Принимая во внимание информацию, собранную в ходе опроса разработчиков из разных уголков мира, проведенного в 2022 году, удалось определить характеристики, которые окружают желаемые «технологические» рабочие места, например,..

Новые материалы

ИИ для общего блага, часть вторая
В нашем последнем блоге мы исследовали возможности ИИ для общего блага, указав на несколько инициатив по поиску действенных решений для продвижения справедливых и беспристрастных систем ИИ. По..

Время расцвета закончилось
Большую часть своей карьеры в индустрии программного обеспечения программисты работали с головой в песок. Успех в отрасли требует навыков презентации и обучения других. Ценность улучшенных..

Будущее сельского хозяйства: новый уровень производительности с современными технологиями
По мере роста населения мира растет и спрос на продукты питания. Фермеры сталкиваются с растущим давлением необходимости повышать урожайность и максимизировать производительность, манипулируя..

Состояние совместной фильтрации в 2022 году, часть 1
ResBeMF: Улучшение прогнозируемого охвата совместной фильтрации на основе классификации (arXiv) Автор: Анхель Гонсалес-Прието , Авраам Гутьеррес , Фернандо Ортега , Рауль Лара-Кабрера..

Зачем изучать PYTHON в 2022 году !
Python — востребованный, доступный язык программирования с активным, постоянно растущим сообществом пользователей. Для тех, кто хочет сменить профессию в мире технологий с помощью..

Решение капч с помощью Puppeteer
Это руководство предназначено для текстовых кодов, а не для reCAPTCHA Google (см. конец этого сообщения). Требования: Антикапча или любой другой сервис по разгадыванию капчи. Модуль..

7 встроенных библиотек Python, которые необходимо знать
7 встроенных библиотек Python, которые необходимо знать Стандартная библиотека Python значительно упрощает жизнь программистов, предоставляя широкий набор функций. Мы выбираем несколько..