eConti - программирование в вопросах и ответах

Публикации по теме 'nlp'


Две минуты НЛП — Задачи GLUE и Таблица лидеров 2022
Задания на одно предложение, задачи на сходство и перефразирование, а также задачи на вывод Здравствуйте, любители НЛП! Сегодня я хочу углубиться в один из самых популярных бенчмарков НЛП, используемых в настоящее время, а именно в GLUE. Хорошее понимание GLUE помогает понять сильные и слабые стороны популярных моделей НЛП, поскольку многие из них оцениваются с его помощью. Наслаждаться! 😄 GLUE , эталон оценки общего понимания языка, представляет собой набор ресурсов для..

Обработка естественного языка (NLP): что это такое? Как это использовать? Полное руководство 2023
Голосовые помощники Alexa, Google Home и Siri основаны на технологиях автоматической обработки речи. Цель: иметь возможность понимать, обрабатывать и генерировать голосовые сообщения. Что такое обработка естественного языка (NLP)? Обработка естественного языка (NLP) или автоматическая обработка языка (TALN) — это ветвь искусственного интеллекта, которая направлена ​​на предоставление машинам возможности понимать, генерировать или переводить человеческий язык так, как он написан...

Синтетические данные и поисковая система BM25
В этой статье мы увидим, как создать поисковую систему с моделью генерации запросов и BM25, и оценим эту систему. В предыдущей статье мы увидели, как точно настроить T5 для генерации запросов. Хотя мы можем использовать его для создания набора данных с псевдомаркировкой, а затем обучать ретривера. Мы также можем создать облегченную систему поиска по ключевым словам с помощью BM25 . Эта идея, которую я хочу попробовать, по сути, сводится к генерации определенного количества запросов..

Выявление скрытых паттернов с помощью t-SNE: руководство для начинающих по нелинейному уменьшению размерности
Нелинейное уменьшение размерности — это метод, используемый для визуализации многомерных данных в более низких измерениях, таких как два или три измерения. Одним из популярных методов нелинейного уменьшения размерности является t-распределенное стохастическое соседнее встраивание (t-SNE). t-SNE — это мощный инструмент для выявления скрытых закономерностей в сложных данных, который широко используется в различных приложениях, включая классификацию изображений, обработку естественного..

Организация и оценка исследовательских идей
Часть 1 этого поста была посвящена поиску исследовательских идей. Но как только вы придумали идею, вам все равно нужно ее конкретизировать (я называю это организацией ) и решить, хотите ли вы работать над ней. В этой части мы рассмотрим и то, и другое, но позвольте мне начать с парочки личных анекдотов. Первый предполагает ту же стажировку в Google, о которой говорилось в Части 1 (на этой стажировке я многому научился). Проработав над проектом около 6 недель , я запланировал..

Путешествие в Extractive Summarizer: предварительная обработка
Это первая статья из серии, целью которой является изучение того, как предварительно обрабатывать текстовые данные и извлекать функции, чтобы в конечном итоге создать классический извлекающий суммировщик с использованием алгоритма машинного обучения. Получить данные В этом примере используется набор данных `cnn_dailymail`, он содержит 2 функции новостных `статей` и соответствующие им `основные моменты`. Поскольку вам нужно убедиться, что у вас достаточно экземпляров для обучения,..

Процесс естественного языка для судебных приговоров с Python
Процесс естественного языка для судебных приговоров с Python Часть 2: Описательная статистика В этой серии статей я проведу серию НЛП-анализов судебных приговоров с целью ответить на два исследовательских вопроса: Наличие хорошо обозначенной базы знаний имеет решающее значение, если вам нужно получить подробную информацию. Архивы прессы обновляются ежедневно, и необходимость вручную маркировать каждую статью может занять много времени. Мой вопрос: возможно ли реализовать алгоритм..

Новые материалы

ИИ для общего блага, часть вторая
В нашем последнем блоге мы исследовали возможности ИИ для общего блага, указав на несколько инициатив по поиску действенных решений для продвижения справедливых и беспристрастных систем ИИ. По..

Время расцвета закончилось
Большую часть своей карьеры в индустрии программного обеспечения программисты работали с головой в песок. Успех в отрасли требует навыков презентации и обучения других. Ценность улучшенных..

Будущее сельского хозяйства: новый уровень производительности с современными технологиями
По мере роста населения мира растет и спрос на продукты питания. Фермеры сталкиваются с растущим давлением необходимости повышать урожайность и максимизировать производительность, манипулируя..

Состояние совместной фильтрации в 2022 году, часть 1
ResBeMF: Улучшение прогнозируемого охвата совместной фильтрации на основе классификации (arXiv) Автор: Анхель Гонсалес-Прието , Авраам Гутьеррес , Фернандо Ортега , Рауль Лара-Кабрера..

Зачем изучать PYTHON в 2022 году !
Python — востребованный, доступный язык программирования с активным, постоянно растущим сообществом пользователей. Для тех, кто хочет сменить профессию в мире технологий с помощью..

Решение капч с помощью Puppeteer
Это руководство предназначено для текстовых кодов, а не для reCAPTCHA Google (см. конец этого сообщения). Требования: Антикапча или любой другой сервис по разгадыванию капчи. Модуль..

7 встроенных библиотек Python, которые необходимо знать
7 встроенных библиотек Python, которые необходимо знать Стандартная библиотека Python значительно упрощает жизнь программистов, предоставляя широкий набор функций. Мы выбираем несколько..