eConti - программирование в вопросах и ответах

Публикации по теме 'parsing'


Пидантик в двух словах
Возможности синтаксического анализа и проверки на основе аннотаций типов. Pydantic — это библиотека для безопасного синтаксического анализа данных в объекты Python с дополнительной проверкой данных… и многим другим. Принятие Множество известных проектов Python ( FastAPI , Project Jupyter ), более 40000 проектов с открытым исходным кодом и компаний ( Microsoft , Amazon Web Services , АНБ , Uber и т. д.) используйте pydantic . Это указывает, насколько ценен..

Вопросы по теме 'parsing'

Библиотеки для очистки HTML
Я ищу дезинфицирующее средство html, которое я могу вызвать для каждого API для дезинфекции строк, которые я получаю из своего веб-приложения. Есть ли какие-нибудь полезные и простые в использовании библиотеки? Кто-нибудь знает, может быть, один или...
25.11.2023

Вопрос по парсингу текста в Perl
Я хочу разобрать строку как это, S1,F2 title including several white spaces (abbr) single,Here<->There,reply И мне нужен вывод, как показано ниже, 1 2 title including several white spaces abbr single Here22There # identify...

где есть достойные примеры/учебники TouchXML
Я пытаюсь понять, как это работает, но пока все, что я, кажется, нахожу, это мертвые ссылки, фрагментированные комментарии или ничего стоящего, чтобы познакомить с этим новичка? Любые указатели приветствуются, спасибо
01.12.2023

C ++, аргументы командной строки не анализируются должным образом
У меня есть программа: int _tmain(int argc, char* argv[]) { std::cout << "STARTING" << std::endl; std::cout << "Num inputs: " << argc << std::endl; for(int i = 0; i < argc; i++) std::cout <<...

Нужен совет по разбору десятичного значения из строки
Мне нужно разобрать количество как десятичное число и код валюты как строку. Строка ввода 302 600.00 RUB 10 000.00 USD Шаблон КОЛИЧЕСТВО->ПРОБЕЛ->КОД ВАЛЮТЫ ДВЕ ДЕСЯТИЧНЫЕ ЦИФРЫ Пробел как разделитель тысяч, точка как десятичный...
17.11.2023

Как я могу получить только текст (без тегов) из HTML-документа?
У меня есть HTML-страница, и мне нужен только текст (все текстовые узлы). Пример HTML <span>hello <strong>sir</strong></span> Желаемый результат hello sir
31.12.2023

Есть ли библиотека PHP для разбора файлов gettext PO POT?
если не в PHP, можно использовать некоторые инструменты командной строки, которые преобразуют файл PO в некоторый структурированный формат, например. XML или что-то другое, что я могу просто обработать в PHP?
11.11.2023

jSoup получить заголовок из тега img
У меня есть сценарий, в котором мне нужно вытащить заголовок из тега img, как показано ниже. <img alt="Bear" border="0" src="/images/teddy/5433.gif" title="Bear"/> Я смог получить URL-адрес изображения. Но как мне получить заголовок из...
09.11.2023

Ищу учебный ресурс, касающийся ассоциативности операторов и приоритета для синтаксического анализатора, который я создаю.
Я использую Parboiled для создания парсера для синтаксиса поиска, который имеет несколько операторов с разным приоритетом и ассоциативность. Поскольку это будет мой первый синтаксический анализатор, было бы неплохо увидеть несколько хороших...

xml в Python с использованием ElementTree
Я новичок в python, и мне нужно проанализировать некоторые грязные файлы xml, которые сначала нужно очистить. У меня есть следующий код на Python: import arff import xml.etree.ElementTree import re totstring="" with open('input.sgm', 'r') as...

Как я могу указать URL-адрес, полный значения json, и eval проанализировать его, используя json2.js?
Как я могу разобрать это в объект eval с помощью json2 dot js? Есть URL-адрес http://blah.com/json.data, который я хочу вызвать с помощью такой кнопки. <input type="button" value"Go" onclick="go()" /> из функции javascript Go я...

iPhone , большое число с плавающей запятой NSRegularExpression
У меня есть следующий код: -(NSString*)getNumberFromString(NSString*)theString{ NSError *error = NULL; NSRegularExpression *regex = [NSRegularExpression regularExpressionWithPattern:@"rhs: \"([0-9]*[.]*[0-9]*)"...

Чтение файла .csv в C
У меня есть файл .csv: lp;imie;nazwisko;ulica;numer;kod;miejscowosc;telefon;email;data_ur 1;Jan;Kowalski;ul. Nowa;1a;11-234;Budry;123-123-456;[email protected];1980.05.13 2;Jerzy;Nowak;ul....
31.12.2023

Добавить объекты в словарь, созданный JSONKit?
В моем проекте мне нужно загрузить несколько файлов json. Я разбираю их с помощью JSONKit и после каждого разбора с помощью NSMutableDictionary *json = [myJSON objectFromJSONString]; Я добавляю их в массив, например: [self.themeArray...

javascript FileReader - разбор длинного файла по частям
У меня есть длинный файл, который мне нужно разобрать. Поскольку это очень долго, мне нужно делать это по частям. Я пробовал это: function parseFile(file){ var chunkSize = 2000; var fileSize = (file.size - 1); var foo =...

Как я могу извлечь что-то конкретное с помощью Jsoup?
Как я могу извлечь полные имена из этого образца HTML-кода? Я хочу получить только следующее. Полное имя1 Полное имя2 Полное имя3 <div class="readerP"> <p><a...

Разбор пользовательского ввода в Python
Мне нужно проанализировать ввод от пользователя, чтобы он имел один из следующих форматов: 1321 .. 123123 or -21323 , 1312321 Число (может быть отрицательным), запятая , или две точки .. , а затем еще одно число (может быть...

Разработка кроссплатформенного парсера — какие есть варианты?
В настоящее время я работаю над проектом, в котором используется собственный язык с простой контекстно-свободной грамматикой . Из-за особенностей проекта один и тот же язык придется использовать на нескольких платформах, особенно на мобильных. В...
23.12.2023

Xtext множественные перекрестные ссылки
Мне нужно правило грамматики Xtext (или несколько), работающее примерно так: 1: CollectionGetElement: 2: val=[VariableReference] '=' 3: (ref=[List] | ref=[Bytefield] | ref=[Map]) 4: '[' keys+=GetElementKeyType ']' ('['...

Парсеры LL-1: действительно ли необходим FOLLOW-Set?
насколько я понимаю, FOLLOW-Set предназначен для того, чтобы сообщить мне в первый возможный момент, если во входном потоке есть ошибка. Это правильно? Потому что иначе мне интересно, зачем вам это на самом деле нужно. Учтите, что ваш парсер...

Новые материалы

ИИ для общего блага, часть вторая
В нашем последнем блоге мы исследовали возможности ИИ для общего блага, указав на несколько инициатив по поиску действенных решений для продвижения справедливых и беспристрастных систем ИИ. По..

Время расцвета закончилось
Большую часть своей карьеры в индустрии программного обеспечения программисты работали с головой в песок. Успех в отрасли требует навыков презентации и обучения других. Ценность улучшенных..

Будущее сельского хозяйства: новый уровень производительности с современными технологиями
По мере роста населения мира растет и спрос на продукты питания. Фермеры сталкиваются с растущим давлением необходимости повышать урожайность и максимизировать производительность, манипулируя..

Состояние совместной фильтрации в 2022 году, часть 1
ResBeMF: Улучшение прогнозируемого охвата совместной фильтрации на основе классификации (arXiv) Автор: Анхель Гонсалес-Прието , Авраам Гутьеррес , Фернандо Ортега , Рауль Лара-Кабрера..

Зачем изучать PYTHON в 2022 году !
Python — востребованный, доступный язык программирования с активным, постоянно растущим сообществом пользователей. Для тех, кто хочет сменить профессию в мире технологий с помощью..

Решение капч с помощью Puppeteer
Это руководство предназначено для текстовых кодов, а не для reCAPTCHA Google (см. конец этого сообщения). Требования: Антикапча или любой другой сервис по разгадыванию капчи. Модуль..

7 встроенных библиотек Python, которые необходимо знать
7 встроенных библиотек Python, которые необходимо знать Стандартная библиотека Python значительно упрощает жизнь программистов, предоставляя широкий набор функций. Мы выбираем несколько..