eConti - программирование в вопросах и ответах

Публикации по теме 'nlp'


Что такое токенизация в НЛП
Чтобы наш компьютер понимал любой текст, необходимо разбить его на формы, понятные нашей машине. Обработка естественного языка (NLP) использует для этой цели концепцию токенизации. Токенизация — это основная часть предварительной обработки текста для моделей на основе трансформеров. Токенизаторы переводят текст в данные, которые может обрабатывать модель. Модели могут обрабатывать только числа, поэтому токенизаторы должны преобразовывать наши текстовые входы в числовые данные...

Узнайте, о чем знаменитости чаще всего пишут в Твиттере
WordCloud с использованием менее 40 строк кода R Угадайте, чей дескриптор в твиттере дает это облако слов? Намеков там достаточно. Вы правы, это Эндрю Нг, который пишет в Твиттере о своем новом курсе глубокого обучения на Coursera! Всегда приятно видеть данные в действии; не так ли? Давайте попробуем создать подобное облако слов для трех мировых лидеров, а именно. Президент США Дональд Трамп, премьер-министр Индии Нарендра Моди и президент России Владимир Путин. Облако слов -..

10 лучших NLP (обработка естественного языка) с курсами Python для начинающих в 2021 году
Сборник лучших онлайн-курсов по изучению Natural Langauge Processing для начинающих в 2021 году Если вы хотите изучить обработку естественного языка или НЛП и ищете лучшие онлайн-курсы для изучения НЛП, то вы попали в нужное место. В прошлом я поделился лучшими курсами для изучения науки о данных , машинного обучения , компьютерного зрения и глубокого обучения , а сегодня я собираюсь поделиться лучшими курсами для изучения обработки естественного языка, одна из самых полезных..

Параметрические и непараметрические модели: понимание различий и выбор правильного подхода
Введение: В области машинного обучения и статистического моделирования есть две основные категории моделей: параметрические и непараметрические. Понимание различий между этими двумя типами моделей важно для ученых и исследователей данных, чтобы выбрать правильный подход к своим данным и стоящей перед ними проблеме. Параметрические модели: Параметрические модели — это те, которые делают предположения об основном распределении данных. Эти предположения часто касаются..

Декодирование машинного обучения: использование возможностей прогнозного анализа
Путешествие в разум машины 1. Введение в машинное обучение "Итак, что такое машинное обучение?" — спросил Тим, любознательный студент, только что погрузившийся в увлекательный мир науки о данных. Что ж, Тим, Машинное обучение (ML) — это просто обучение компьютеров обучению на собственном опыте. Это похоже на то, как мы, люди, учимся кататься на велосипеде: мы пытаемся, терпят неудачу, приспосабливаемся и, в конце концов, добиваемся успеха. Разница? Машины могут делать это в..

Обобщение текста в НЛП
Живя в 21 веке, когда в Интернете ежедневно генерируются петабайты данных, очень трудно понять любую тему не только из-за отсутствия информации, но и из-за огромного количества доступного контента, что делает его проблемой изобилия. Итак, вам на помощь приходит Text Summarization. Резюмирование текста - это процесс извлечения точных резюме из длинных фрагментов текста. Намерение состоит в том, чтобы создать точное и понятное резюме, содержащее только основные моменты, изложенные..

НЛП: извлечение основных тем из набора данных с помощью LDA за считанные минуты
Делаем крутые вещи с данными! Недавно я начал изучать скрытое распределение Дирихле (LDA) для тематического моделирования и был поражен тем, насколько мощным оно может быть и в то же время быстрым. Тематическое моделирование - это задача использования обучения без учителя для извлечения основных тем (представленных в виде набора слов), которые встречаются в коллекции документов. Я протестировал алгоритм на наборе данных 20 групп новостей, который содержит тысячи новостных статей из..

Новые материалы

ИИ для общего блага, часть вторая
В нашем последнем блоге мы исследовали возможности ИИ для общего блага, указав на несколько инициатив по поиску действенных решений для продвижения справедливых и беспристрастных систем ИИ. По..

Время расцвета закончилось
Большую часть своей карьеры в индустрии программного обеспечения программисты работали с головой в песок. Успех в отрасли требует навыков презентации и обучения других. Ценность улучшенных..

Будущее сельского хозяйства: новый уровень производительности с современными технологиями
По мере роста населения мира растет и спрос на продукты питания. Фермеры сталкиваются с растущим давлением необходимости повышать урожайность и максимизировать производительность, манипулируя..

Состояние совместной фильтрации в 2022 году, часть 1
ResBeMF: Улучшение прогнозируемого охвата совместной фильтрации на основе классификации (arXiv) Автор: Анхель Гонсалес-Прието , Авраам Гутьеррес , Фернандо Ортега , Рауль Лара-Кабрера..

Зачем изучать PYTHON в 2022 году !
Python — востребованный, доступный язык программирования с активным, постоянно растущим сообществом пользователей. Для тех, кто хочет сменить профессию в мире технологий с помощью..

Решение капч с помощью Puppeteer
Это руководство предназначено для текстовых кодов, а не для reCAPTCHA Google (см. конец этого сообщения). Требования: Антикапча или любой другой сервис по разгадыванию капчи. Модуль..

7 встроенных библиотек Python, которые необходимо знать
7 встроенных библиотек Python, которые необходимо знать Стандартная библиотека Python значительно упрощает жизнь программистов, предоставляя широкий набор функций. Мы выбираем несколько..