Mykola
https://cheatography.com/davechild/cheat-sheets/regular-expressions/
Можливо ще знаєш де можна вивчити Linux bash?
Виталик Голоенко
Ну вообще тут я вижу 4 варианта решений 1 через switch 2 regex 3 if else 4 ? True : False
Mykola
Пам'ятаєш як ти писав що корисно це знати через скрипти, ssh і багато чого іншого
Andrii
А есть где-то полноценный источник где его можно полностью изучить?
Надо только понимать, что по регэкспу строится обычный конечный автомат, магазинной памяти там нет. Поэтому что-то запомнить по хожу низя
Mykola
bash или тулзы?
Я думав це все можна через bash, але як не знаю
Mykola
bash или тулзы?
Те що корисніше
Andrii
Сам bash вполне можно заменить pyhton. Скорее надо тулзы
Mykola
Хоча з bash я хоча би щось знаю, а tools ніякі
Mykola
Сам bash вполне можно заменить pyhton. Скорее надо тулзы
Можливо в них є якась назва щоб я міг знайти сам?
Andrii
Хоча з bash я хоча би щось знаю, а tools ніякі
https://www.funtoo.org/Linux_Fundamentals,_Part_1
Andrii
Хоча з bash я хоча би щось знаю, а tools ніякі
Ты путаешь скорее всего... bash это интерпретатор команд. Обычно ты вводишь команду типа cd /opt
Andrii
И это просто запуск программы cd и передача ей в качестве параметра /opt
Andrii
А вот когда ты начинаешь использовать $VARIABLE это bash
Andrii
Просто bash нужен для того, чтобы запускать другие программы
Andrii
Плюс немного обвязки над этим
Mykola
Просто bash нужен для того, чтобы запускать другие программы
Тепер ясно чого я весь час не міг зрозуміти як ви там хочете писати скрипти
Mykola
Бо я якраз думав про стандартні команди типу cd
Mykola
https://www.funtoo.org/Linux_Fundamentals,_Part_1
Ви теж звідси вчили bash чи надіслали мені будь - який сайт?
Виталик Голоенко
ofc regex
Что за ofc?
Адъютант
off cource
Виталик Голоенко
А, ну да)
Виталик Голоенко
Если у тебя есть проблема, и ты решаешь ее с помощью regex, то у тебя уже 2 проблемы (С) народная мудрость
Виталик Голоенко
:)
Адъютант
Andrii
Бо я якраз думав про стандартні команди типу cd
cd это всё-таки внутренняя команда... Но вот cp (копирование) уже отдельная программа. Вот её исходник: https://github.com/coreutils/coreutils/blob/master/src/cp.c
Виталик Голоенко
Ключевое слово "если" :)
Адъютант
значит для меня нет проблемы если есть регекс
Адъютант
одно, он одноразовый
Andrii
Ви теж звідси вчили bash чи надіслали мені будь - який сайт?
Там скорее командная строка. И bash и стандартные программы
Максим
значит для меня нет проблемы если есть регекс
Регекс эт регулярка имеется в виду?
Адъютант
+
Максим
+
Кстати, можно регуляркой нормально с html работать?
Mykola
У вакансіях я часто бачу вимогу знання Linux. Тобто це bash і командний рядок? @mustitz
Igor
Кстати, можно регуляркой нормально с html работать?
нельзя :) хотя зависит от того что вы имете ввиду под нормально
Максим
хз
У меня часто 0x98 примерно такое вместо пробелов выскакивает
Andrii
Кстати, можно регуляркой нормально с html работать?
Нет, там допускается неоганиченная вроженность тегов
Адъютант
ты имеешь ввиджу на веб странице использовать регекс
Адъютант
да все так делают
Адъютант
твой телефон даже в звонилке
Andrii
Кстати, можно регуляркой нормально с html работать?
Регулярка даёт на выходе конечный автомат. Конечный автомат может определять только регулярные грамматики. HTML и XML не является регулярной, это КС грамматика.
Адъютант
Ну теги почистить)
Если ты хочешь у клиента то яхз если ты хочешь в продакшне то да, сублайм поддерживает использование регекса
Максим
Если ты хочешь у клиента то яхз если ты хочешь в продакшне то да, сублайм поддерживает использование регекса
Я rss парсил недавно, там допустим description, а в нем изображение с текстом, мне нужен текст
Andrii
Кстати, можно регуляркой нормально с html работать?
Поэтому можно прочитать отдельный открывающий тэг от < и до >. А вот получить текст внутри тэга уже нельзя
Адъютант
Поэтому можно прочитать отдельный открывающий тэг от < и до >. А вот получить текст внутри тэга уже нельзя
Можно считывать нужный тег от открывающего до закрытия. А затем уже другой регуляркой чистить от тегов
Максим
Я rss парсил недавно, там допустим description, а в нем изображение с текстом, мне нужен текст
Что-то получил, но иногда вместо пробелов 4 символа, например 9x32
Azamat
Какие различия между flask и django
Azamat
?
Andrii
Можно считывать нужный тег от открывающего до закрытия. А затем уже другой регуляркой чистить от тегов
Должна быть логика отдельно от регулярки, которая считает число открытых тэгов
Адъютант
или искать регуляркой до тех пор пока после фильтрации не найдешь текст
Максим
Что-то получил, но иногда вместо пробелов 4 символа, например 9x32
Я это отдавал в csv, а дальше делал рекомендации
Igor
Какие различия между flask и django
джанго все из коробки жри что дают, фласк прикрути что нравится но ебись сам :)
Адъютант
конечнй автомат это закрытая логика если я не ошибаюсь
Andrii
Конечный автомат, если не ошибаюсь, то он постоянно меняет состояние?
Нет, конечный автомат это программа без переменных. Мы ничего не можем запомнить
Адъютант
регулярка ищет то что в ней написано и ничего более
Igor
формулировка слова "запомнить" весьма свободна
Mykola
Там скорее командная строка. И bash и стандартные программы
У вакансіях я часто бачу вимогу знання Linux. Тобто це bash і командний рядок?
Igor
Должна быть логика отдельно от регулярки, которая считает число открытых тэгов
а можно пример html который не будет парситься рекурсивными регексами? я не докапывуаюсь мне реально интересно
Andrii
У вакансіях я часто бачу вимогу знання Linux. Тобто це bash і командний рядок?
Или понимания принципов функционирования ядра Linux, если это разработка драйверов :)
Максим
Понял спасибо, нужно перечитать за них
Максим
конечнй автомат это закрытая логика если я не ошибаюсь
Максим
Нет, конечный автомат это программа без переменных. Мы ничего не можем запомнить
Максим
Одну лекцию дали по ним
Andrii
а можно пример html который не будет парситься рекурсивными регексами? я не докапывуаюсь мне реально интересно
Мы можем написать в regexp, скажем, не более трёх вложений. Но это будет адъ и израиль, копипаста. Но общего решения для произвольного числа вложений нету
Igor
<div><div><div><div>...</div></div></div></div>
ну предлагали обрабатывать не одним регексом а одним регексом находить самый первый таг и его внутренности дальше вызывать парсинг рекурсивно
Igor
Так можно, но это уже не чистый регэксп, а машина Тьюринга у тебя.
еще раз не у меня а в обсуждении, я вижу самую большую проблему в том что если у нас html с левого ресурса то это вовсе не значит что он соответсвует стандарту он может корректно отображаться но при этом не быть корректно отформатированным с точки зрения html