
Andriy
19.06.2018
12:59:00
а на pugixml смотрели?

Ilia
19.06.2018
12:59:08
Здравствуйте, коллеги! Нахожусь в поисках кроссплатформенной либы для парсинга XMLданных. Загвоздка в том, что либа должна уметь парсить UTF-16 текст, а именно char16_t/std::u16string (НЕ wchar_t) с текстового буфера (НЕ локального файла) без преобразования. RapidXML, TinyXML, XercesC++, XmlInspector, irrxml - уже изучил, Возможно, я пропустил какую-то либу или еще не нашел. Подскажите, господа, что можно использовать для моих целей (если не писать свой велосипед, конечно). Спасибо!
Google :: gumbo ?

Alexander
19.06.2018
12:59:34

Ilia
19.06.2018
12:59:49
Так всё одно DOM...

Google

Ilia
19.06.2018
13:00:00
Я полагаю, ему пофигу.

Alexander
19.06.2018
13:00:04
ну так то это не одно и то же

Ilia
19.06.2018
13:00:18
Современный -- одно и то же.
Но я уточню...

Vhäldemar
19.06.2018
13:01:20

Ilia
19.06.2018
13:02:11

Andriy
19.06.2018
13:04:09
ух ты, это можно юзать парсеры для html получается, с целями парсинга xml... никогда бы не додумался до такого. Спасибо большое! Буду копать в эту сторону.

Ilia
19.06.2018
13:04:32
Google :: gumbo ?
Gumbo по другим параметрам не покатит:
Non-goals: Support for encodings other than UTF-8

Andriy
19.06.2018
13:06:04
Но все равно круг поиска расширяется, ибо будут валидными и html парсеры, я правильно понимаю?

Побитый
19.06.2018
13:07:41

Andriy
19.06.2018
13:08:44
А наоборот не проконает?

Побитый
19.06.2018
13:10:50
А наоборот не проконает?
Логичнее полагать, что нет. Так как html имеет определенную структуру (тег html, body, head и тд). Поэтому если натравить парсер html на произвольный xml, то он скорее всего будет их искать, не найдёт и скажет, что ты дурак, дичь ему подсовываешь. Но надо проверить)))

Andriy
19.06.2018
13:11:57
Интересно. Спасибо!

Google

Constantine
19.06.2018
13:12:47

Ilia
19.06.2018
13:13:39
Ну да. Но в HTML5 весь должен быть XHTML
Но может это лишь мои мячты...
Что Gumbo может XML я так и не нашёл.

Kitsu
19.06.2018
13:14:38

Ilia
19.06.2018
13:19:01
Ошибки и в XML допустимы.

Дмитрий
19.06.2018
13:20:06
Там точно есть отличие что в хтмл можно писать атрибуты без значения как async, а в xml надо async="async"

Ilia
19.06.2018
13:21:04

Ignat
19.06.2018
13:21:51
о какой половине высказывания?

Ilia
19.06.2018
13:22:20
"можно писать атрибуты без значения как async, а в xml надо async="async""

Дмитрий
19.06.2018
13:22:50
У меня точно модуль в nginx ругался именно на это место

Ilia
19.06.2018
13:23:07
Я могу сказать чем точно отличается.
HTML -- это SGML общий. А XML -- SGML строгий.

Дмитрий
19.06.2018
13:23:10
Но это давно было, я спеку бегло читал

Ignat
19.06.2018
13:24:06
в общем, там два высказывания: про "нужно в XML" и "не нужно в HTML", и вроде оба верны

Дмитрий
19.06.2018
13:24:08
Но ругался именно, что атрибут невалидный

Ilia
19.06.2018
13:29:27
Я могу сказать чем точно отличается.
HTML -- это SGML общий. А XML -- SGML строгий.
Это значит следующее: в XML каждый открывающийся тег ОБЯЗАН быт закрыт. Тэги могут только вкладываться друг в друга, но не пересекаться по продожительности.
HTML (как и нестрогий SGML) же такой жёсткости не подразумевает, там тэги могут НЕ ЗАКРВАТЬСЯ. При этом распарсить корректно такие SGML нельзя, нужно долбавлять семантические правила, ограничивающие обрасть действия тэга. Обычно это определяют как "Тэг действует до конца его родительского тэга", а также другие семантические ограничения, типа правил, до каких пор действую определённые тэги.
Например, тег <B> , описывающий в HTML шрифт с жирным написанием, может быть закрыт явно, а может не быть закрыт, и тогда он действует до конца охватывающего его тега. Охватывающий тег должен быть ещё не просто так, а определённого типа.


Stolyarchuk
19.06.2018
13:33:10
<address type='pci' domain='0x0000' bus='0x00' slot='0x08' function='0x0'/>
вполне валидный xml

Ilia
19.06.2018
13:37:24
валидный. Почему нет-то?

Google

Stolyarchuk
19.06.2018
13:38:26
РедХат с вами не согласен

Vhäldemar
19.06.2018
13:39:56

Stolyarchuk
19.06.2018
13:42:23
в строгости использования двойных/одинарных кавычек в описании дерева

Ilia
19.06.2018
13:44:10

Stolyarchuk
19.06.2018
13:45:10

Ilia
19.06.2018
13:45:43

Vhäldemar
19.06.2018
13:45:48
а что же говорит рфц?

Ilia
19.06.2018
13:46:14

Vhäldemar
19.06.2018
13:46:31
да ладно

Stolyarchuk
19.06.2018
13:46:44

Ilia
19.06.2018
13:46:46
Да какая разницы?

Vhäldemar
19.06.2018
13:47:09
блин, точно

Stolyarchuk
19.06.2018
13:47:22
всё текст

Vhäldemar
19.06.2018
13:49:07
AttValue ::= '"' ([^<&"] | Reference)* '"'
| "'" ([^<&'] | Reference)* "'"
судя по в3ц там пофиг какие quotes или я не то смотрю

Max
19.06.2018
13:52:04
Кто в gtest шарит, как сделать EXPECT_CALL(*instance, foo(param)).Times(1), если паметром есть`std::initializer_list`? Матчер прикрутить не выходит

Stolyarchuk
19.06.2018
14:01:27

Max
19.06.2018
14:07:40

Stolyarchuk
19.06.2018
14:07:48
какая разница..
там же написано

Google

Stolyarchuk
19.06.2018
14:08:06
оберните макрос в вариадик-шиблон

Andrey
19.06.2018
14:17:22
Тут Майерс новую книгу хвалит (чужую) http://scottmeyers.blogspot.com/2018/06/interesting-book-modern-c-challenge.html

Admin
ERROR: S client not available

Andrey
19.06.2018
14:17:31
Кто нибудь уже читал? Стоит время потратить?

Ilia
19.06.2018
14:18:57
:-)

Andrey
19.06.2018
14:22:07
Хорошо
)

Ilia
19.06.2018
14:23:02
Я что-то не понял. Это типа кукбука, или это на примерах показываются всякие фичи?

Andrey
19.06.2018
14:33:56
Ну да, всякие прикладные задачи типо
Очень прикладные

Constantine
19.06.2018
17:26:46
а я правильно понимаю, что в С++17 есть смысл сразу объявлять
namespace details
{
template <typename T>
struct integer_alias_helper_type {
enum class inner : int {};
};
}
template <typename T>
using integer_alias_type = typename details::integer_alias_helper_type<T>::inner;
namespace details { struct some_alias {}; }
using some_integer_alias = integer_alias_type<details::some_alias>;

Vhäldemar
19.06.2018
18:05:45
https://github.com/crosetto/AutomaticDifferentiation/blob/master/README.md
шо скажете?

Antony
19.06.2018
19:24:34

Constantine
19.06.2018
19:25:14

Antony
19.06.2018
19:26:18
О! Спасибо
Локальная структура в объявлении с непривычки взрывает мозг. Часто используется эта фишка в Boost.Exception
Пользуйтесь на здоровье :)

Igor
19.06.2018
19:51:19

Google

Constantine
19.06.2018
19:53:08

Igor
19.06.2018
19:58:31

Роман
19.06.2018
20:03:35
Товарищи, а никто не встречал библиотеки для футпринтинга текстов?

Igor
19.06.2018
20:07:23

Роман
19.06.2018
20:08:02
Поясните что имеется ввиду.
Чтобы определять степень похожести текстов.
Минимальная задача такая - находить абзац в тексте после изменения текста (возможно, этого же абзаца)

/dev
19.06.2018
20:09:31

Igor
19.06.2018
20:15:31

Constantine
19.06.2018
20:15:39

Роман
19.06.2018
20:19:22

Юра Незнанов
19.06.2018
20:25:43

Assasin
19.06.2018
20:46:40