Публикации по теме 'parsing'
Пидантик в двух словах
Возможности синтаксического анализа и проверки на основе аннотаций типов.
Pydantic — это библиотека для безопасного синтаксического анализа данных в объекты Python с дополнительной проверкой данных… и многим другим.
Принятие
Множество известных проектов Python ( FastAPI , Project Jupyter ), более 40000 проектов с открытым исходным кодом и компаний ( Microsoft , Amazon Web Services , АНБ , Uber и т. д.) используйте pydantic . Это указывает, насколько ценен..
Вопросы по теме 'parsing'
Библиотеки для очистки HTML
Я ищу дезинфицирующее средство html, которое я могу вызвать для каждого API для дезинфекции строк, которые я получаю из своего веб-приложения. Есть ли какие-нибудь полезные и простые в использовании библиотеки? Кто-нибудь знает, может быть, один или...
25.11.2023
Вопрос по парсингу текста в Perl
Я хочу разобрать строку как это,
S1,F2 title including several white spaces (abbr) single,Here<->There,reply
И мне нужен вывод, как показано ниже,
1
2
title including several white spaces
abbr
single
Here22There # identify...
19.01.2024
где есть достойные примеры/учебники TouchXML
Я пытаюсь понять, как это работает, но пока все, что я, кажется, нахожу, это мертвые ссылки, фрагментированные комментарии или ничего стоящего, чтобы познакомить с этим новичка?
Любые указатели приветствуются, спасибо
01.12.2023
C ++, аргументы командной строки не анализируются должным образом
У меня есть программа:
int _tmain(int argc, char* argv[])
{
std::cout << "STARTING" << std::endl;
std::cout << "Num inputs: " << argc << std::endl;
for(int i = 0; i < argc; i++)
std::cout <<...
16.01.2024
Нужен совет по разбору десятичного значения из строки
Мне нужно разобрать количество как десятичное число и код валюты как строку.
Строка ввода
302 600.00 RUB
10 000.00 USD
Шаблон
КОЛИЧЕСТВО->ПРОБЕЛ->КОД ВАЛЮТЫ
ДВЕ ДЕСЯТИЧНЫЕ ЦИФРЫ
Пробел как разделитель тысяч, точка как десятичный...
17.11.2023
Как я могу получить только текст (без тегов) из HTML-документа?
У меня есть HTML-страница, и мне нужен только текст (все текстовые узлы).
Пример HTML
<span>hello <strong>sir</strong></span>
Желаемый результат
hello sir
31.12.2023
Есть ли библиотека PHP для разбора файлов gettext PO POT?
если не в PHP, можно использовать некоторые инструменты командной строки, которые преобразуют файл PO в некоторый структурированный формат, например. XML или что-то другое, что я могу просто обработать в PHP?
11.11.2023
jSoup получить заголовок из тега img
У меня есть сценарий, в котором мне нужно вытащить заголовок из тега img, как показано ниже.
<img alt="Bear" border="0" src="/images/teddy/5433.gif" title="Bear"/>
Я смог получить URL-адрес изображения. Но как мне получить заголовок из...
09.11.2023
Ищу учебный ресурс, касающийся ассоциативности операторов и приоритета для синтаксического анализатора, который я создаю.
Я использую Parboiled для создания парсера для синтаксиса поиска, который имеет несколько операторов с разным приоритетом и ассоциативность. Поскольку это будет мой первый синтаксический анализатор, было бы неплохо увидеть несколько хороших...
02.11.2023
xml в Python с использованием ElementTree
Я новичок в python, и мне нужно проанализировать некоторые грязные файлы xml, которые сначала нужно очистить.
У меня есть следующий код на Python:
import arff
import xml.etree.ElementTree
import re
totstring=""
with open('input.sgm', 'r') as...
13.11.2023
Как я могу указать URL-адрес, полный значения json, и eval проанализировать его, используя json2.js?
Как я могу разобрать это в объект eval с помощью json2 dot js?
Есть URL-адрес http://blah.com/json.data, который я хочу вызвать с помощью такой кнопки.
<input type="button" value"Go" onclick="go()" />
из функции javascript Go я...
07.01.2024
iPhone , большое число с плавающей запятой NSRegularExpression
У меня есть следующий код:
-(NSString*)getNumberFromString(NSString*)theString{
NSError *error = NULL;
NSRegularExpression *regex = [NSRegularExpression regularExpressionWithPattern:@"rhs: \"([0-9]*[.]*[0-9]*)"...
17.12.2023
Чтение файла .csv в C
У меня есть файл .csv:
lp;imie;nazwisko;ulica;numer;kod;miejscowosc;telefon;email;data_ur
1;Jan;Kowalski;ul. Nowa;1a;11-234;Budry;123-123-456;[email protected];1980.05.13
2;Jerzy;Nowak;ul....
31.12.2023
Добавить объекты в словарь, созданный JSONKit?
В моем проекте мне нужно загрузить несколько файлов json. Я разбираю их с помощью JSONKit и после каждого разбора с помощью
NSMutableDictionary *json = [myJSON objectFromJSONString];
Я добавляю их в массив, например:
[self.themeArray...
23.01.2024
javascript FileReader - разбор длинного файла по частям
У меня есть длинный файл, который мне нужно разобрать. Поскольку это очень долго, мне нужно делать это по частям. Я пробовал это:
function parseFile(file){
var chunkSize = 2000;
var fileSize = (file.size - 1);
var foo =...
20.12.2023
Как я могу извлечь что-то конкретное с помощью Jsoup?
Как я могу извлечь полные имена из этого образца HTML-кода? Я хочу получить только следующее.
Полное имя1
Полное имя2
Полное имя3
<div class="readerP">
<p><a...
20.12.2023
Разбор пользовательского ввода в Python
Мне нужно проанализировать ввод от пользователя, чтобы он имел один из следующих форматов:
1321 .. 123123
or
-21323 , 1312321
Число (может быть отрицательным), запятая , или две точки .. , а затем еще одно число (может быть...
07.11.2023
Разработка кроссплатформенного парсера — какие есть варианты?
В настоящее время я работаю над проектом, в котором используется собственный язык с простой контекстно-свободной грамматикой .
Из-за особенностей проекта один и тот же язык придется использовать на нескольких платформах, особенно на мобильных. В...
23.12.2023
Xtext множественные перекрестные ссылки
Мне нужно правило грамматики Xtext (или несколько), работающее примерно так:
1: CollectionGetElement:
2: val=[VariableReference] '='
3: (ref=[List] | ref=[Bytefield] | ref=[Map])
4: '[' keys+=GetElementKeyType ']' ('['...
16.01.2024
Парсеры LL-1: действительно ли необходим FOLLOW-Set?
насколько я понимаю, FOLLOW-Set предназначен для того, чтобы сообщить мне в первый возможный момент, если во входном потоке есть ошибка. Это правильно?
Потому что иначе мне интересно, зачем вам это на самом деле нужно. Учтите, что ваш парсер...
25.01.2024
Новые материалы
ИИ для общего блага, часть вторая
В нашем последнем блоге мы исследовали возможности ИИ для общего блага, указав на несколько инициатив по поиску действенных решений для продвижения справедливых и беспристрастных систем ИИ. По..
Время расцвета закончилось
Большую часть своей карьеры в индустрии программного обеспечения программисты работали с головой в песок.
Успех в отрасли требует навыков презентации и обучения других.
Ценность улучшенных..
Будущее сельского хозяйства: новый уровень производительности с современными технологиями
По мере роста населения мира растет и спрос на продукты питания. Фермеры сталкиваются с растущим давлением необходимости повышать урожайность и максимизировать производительность, манипулируя..
Состояние совместной фильтрации в 2022 году, часть 1
ResBeMF: Улучшение прогнозируемого охвата совместной фильтрации на основе классификации (arXiv)
Автор: Анхель Гонсалес-Прието , Авраам Гутьеррес , Фернандо Ортега , Рауль Лара-Кабрера..
Зачем изучать PYTHON в 2022 году !
Python — востребованный, доступный язык программирования с активным, постоянно растущим сообществом пользователей. Для тех, кто хочет сменить профессию в мире технологий с помощью..
Решение капч с помощью Puppeteer
Это руководство предназначено для текстовых кодов, а не для reCAPTCHA Google (см. конец этого сообщения).
Требования:
Антикапча или любой другой сервис по разгадыванию капчи. Модуль..
7 встроенных библиотек Python, которые необходимо знать
7 встроенных библиотек Python, которые необходимо знать
Стандартная библиотека Python значительно упрощает жизнь программистов, предоставляя широкий набор функций. Мы выбираем несколько..