@haskellru

Страница 292 из 1551
Vasiliy
08.06.2017
13:47:22
страуструпа перед сном хорошо читать, засыпаешь мгновенно

Alexander
08.06.2017
13:48:01
страуструпа перед сном хорошо читать, засыпаешь мгновенно
а когда перестает помогать - можно переключиться на драфты стандартов

Андрей
08.06.2017
13:48:03
да таких много книг. я одно время от теории категорий засыпал отлично ?

Dmitry
08.06.2017
14:54:34
tagsoup прикольный. но очень тормозной. на порядок тормознее xml-lens или как там его.

Google
Alexander
08.06.2017
15:04:45
хз, вроде быстро работал, зависит от того как парсер писать

Илья
08.06.2017
15:58:18
Ребят вы в регулярках тут шарите?

Shorty(Ale Chapa) Manskiy
08.06.2017
15:59:01
есть немного, но я не знаю хаскел.

Илья
08.06.2017
16:00:02
Есть текст, надо найти в нем слова, но слова могут отделяться не только пробелом, но и например '-' или '/'. И мало того надо чтобы если слово длиннее заданного количества символов (например 7) то оно должно разделиться на два матча (или несколько, в общем частями по n-символов).

Я пытался вот так сделать, но неправильно работает https://regex101.com/r/WmZxwp/6

Vasiliy
08.06.2017
16:02:54
так - и / разделяют слова или являются частью слова?

Shorty(Ale Chapa) Manskiy
08.06.2017
16:03:58
> то оно должно разделиться на два матча (или несколько, в общем частями по n-символов). а если не кратно N ?

Илья
08.06.2017
16:04:32
так - и / разделяют слова или являются частью слова?
Одновременно и разделяют слова и являются их частью. ? Такая вот муть... Т.е. вот например есть дата "29/11/2009" и ограничение в 8 символов, должно получится два матча "29/11/" и "2009", а сейчас получается "29/11/20" и "09"

Vasiliy
08.06.2017
16:05:10
ужс

я думаю, проще забить на регекспы и написать нормальный человеческий код

Илья
08.06.2017
16:06:22
я думаю, проще забить на регекспы и написать нормальный человеческий код
Угу, я так тоже сначала подумал, но с такой **анутой логикой обычным кодом тоже не комильфо...

Aragaer
08.06.2017
16:06:47
а, \w не матчит эти символы

Google
Илья
08.06.2017
16:06:49
Пытался и кодом и регулярками, но пока никак...

Aragaer
08.06.2017
16:06:53
если в этом смысле

Vasiliy
08.06.2017
16:07:03
да ладно

разбил по пробелам, сгруппировал по 7 символов, разбил по /, что тут сложного?

тупо, но зато просто и понятно

а за регексп ты себя будешь ненавидеть в тот самый момент, когда решишь что-то в нём поменять

Shorty(Ale Chapa) Manskiy
08.06.2017
16:08:50
29/11/2009 а разве не на три части должно разделяться 29 11 2009? т.е. как вообще получается "29/11/" и "2009"?

Aragaer
08.06.2017
16:08:51
я не понял, что требуется сделать 8)

Илья
08.06.2017
16:09:42
29/11/2009 а разве не на три части должно разделяться 29 11 2009? т.е. как вообще получается "29/11/" и "2009"?
В отличии от пробелов вот эти символы '-' и '/' являются частью слов и должны в них присутстовать.

Shorty(Ale Chapa) Manskiy
08.06.2017
16:10:21
значит должно быть так 29/11/2009

Илья
08.06.2017
16:10:37
значит должно быть так 29/11/2009
В 8 символов не влезает же

Shorty(Ale Chapa) Manskiy
08.06.2017
16:10:58
не пытайя все сделать за один раз...

Илья
08.06.2017
16:11:00
Они тоже учитываются в длине

Shorty(Ale Chapa) Manskiy
08.06.2017
16:11:21
... найди длинные слова, и обработай отдельно.

... а иначе выйдет очень сложно, если вообще выйдет.

Илья
08.06.2017
16:13:10
Ну да, возможно попробую пропустить через эту свою регулярку и потом еще в коде обработать дополнительно.

Denis
08.06.2017
16:16:01
а если Parsecoм?

Aragaer
08.06.2017
16:19:53
повторите условие задачи пожалуйста

а то я пропустил

\w{1,6}\>|\w{7}

Google
Aragaer
08.06.2017
16:22:31
что-то в таком духе должно прокатить

Shorty(Ale Chapa) Manskiy
08.06.2017
16:29:25
Попытайся поделить строки на категории, например — даты, имена, Н\Д, и т.п. А потом отдельно их и разбирай.

Илья
08.06.2017
16:46:43
Попытайся поделить строки на категории, например — даты, имена, Н\Д, и т.п. А потом отдельно их и разбирай.
Само собой они парсятся отдельно, у них даже длины разные. Например для дат 8 символов, а для ФИО 7.

Есть текст, надо найти в нем слова, но слова могут отделяться не только пробелом, но и например '-' или '/'. И мало того надо чтобы если слово длиннее заданного количества символов (например 7) то оно должно разделиться на два матча (или несколько, в общем частями по n-символов).

Aragaer
08.06.2017
16:51:23
да

\w{1,6}\>|\w{7}

вот такой регексп не катит?

то есть от 1 до 6 альфанумерик символов и потом разделитель слова, либо же ровно 7 символов

Илья
08.06.2017
16:56:14
вот такой регексп не катит?
Не катит как минимум потому что \w это только латинские символы.

Я же приводил свою регулярку

https://regex101.com/r/WmZxwp/6

Aragaer
08.06.2017
17:00:44
чот оно странно работает

а, оно почему-то не считает окончание слова на русском языке за \b

https://regex101.com/r/WmZxwp/7 - вот. Выглядит жутко, но вроде оно

Илья
08.06.2017
17:05:44
https://regex101.com/r/WmZxwp/7 - вот. Выглядит жутко, но вроде оно
Неа, не то. Оно съело символы '-' и '/', а они должны остаться.

Aragaer
08.06.2017
17:06:08
а

https://regex101.com/r/WmZxwp/8 - так?

или на символы / и - должно кончаться?

Shorty(Ale Chapa) Manskiy
08.06.2017
17:08:15
тебе слово Константин нужно разбить ра две части Констан и тин ?

Google
Aragaer
08.06.2017
17:09:28
1,6 это значит от 1 до 6, как можно больше

Илья
08.06.2017
17:09:33
https://regex101.com/r/WmZxwp/8 - так?
Тоже не так. "29/11/2009" должно разбиться на "29/11/" и "2009" (при ограничении в 8 символов).

1,6 это значит от 1 до 6, как можно больше
Я в курсе, просто я не ставил такой цифры

Vasiliy
08.06.2017
17:10:09
от одного до шести символов, если после них нет ещё одного символа, иначе семь

Vasiliy
08.06.2017
17:10:30
> "29/11/2009" должно разбиться на "29/11/" и "2009" вот это полный фарш

Admin
ERROR: S client not available

Aragaer
08.06.2017
17:10:45
ну это чуть сложнее, да

или даже не чуть

12345/7 на что надо разбивать?

Илья
08.06.2017
17:11:56
12345/7 на что надо разбивать?
Скорее всего на 12345/ и 7, но такого не будет. Там только даты в нормальном формате и ФИО.

Aragaer
08.06.2017
17:12:36
ну просто надо ли писать так - если после 7 символов идет еще одна буква-цифра, то тогда надо было брать только до последнего минуса или слэша

Vasiliy
08.06.2017
17:13:18
наверное, проще будет воспользоваться тем, что в датах есть /, а в фамилиях его быть не может

Aragaer
08.06.2017
17:15:05
https://regex101.com/r/WmZxwp/9 - во какой капец

Илья
08.06.2017
17:16:34
https://regex101.com/r/WmZxwp/9 - во какой капец
Погоди погоди. Даты и ФИО надо тестить отдельно. Для дат ограничение 8 символов, а для ФИО 7 символов.)))

Google
Aragaer
08.06.2017
17:17:17
да, надо просто написать простенький парсер, который будет по символу считывать и менять состояние стейт машины

Илья
08.06.2017
17:17:46
Или нет, пардон перепутал. Это для номеров там 8 символов, для дат и ФИО одинаково 7.

Aragaer
08.06.2017
17:17:49
ну то есть конечно можно после этого воспользоваться тем, что регекспы тоже имеют стейт машину...

короче надо написать регексп для имени, фамилии, отчества, номера, даты - каждый отдельно и независимо

Илья
08.06.2017
17:18:36
Возможно будет понятнее если я скажу что мне просто напросто нужно вывести вот эту чертову форматированную таблицу в файл



Aragaer
08.06.2017
17:18:43
а потом последовательно их применять

во

надо сначала распарсить на куски, а потом уже в кусках расставить переносы

а потом из кусков построить результат

Илья
08.06.2017
17:19:26
да я так и делаю

У меня уже есть данные (они из другого файла берутся), а мне как раз надо сформировать таблицу вот в таком формате.

Aragaer
08.06.2017
17:21:53
ну а так просто же. zip_longest([номер], "побить по 8 символов дату", "побить по 7 символов фио")

Илья
08.06.2017
17:23:19
ну а так просто же. zip_longest([номер], "побить по 8 символов дату", "побить по 7 символов фио")
Я же сказал - я перепутал, они оба по 7 все-таки. И я не на хаскеле это пишу, я просто подумал что тут люди обитают которые знают все на свете, включая регексы. ?

Shorty(Ale Chapa) Manskiy
08.06.2017
17:23:46
Тебе определенно не нужны регулярные выражения. Что там тильда ~ означает ?

Aragaer
08.06.2017
17:23:54
а zip_longest это я из питона взял

ничего вроде

Shorty(Ale Chapa) Manskiy
08.06.2017
17:24:38
C++ ?

Илья
08.06.2017
17:24:40
Там просто еще ограничение на количество символов вертикально на странице. Когда оно исчерпывается - то надо сделать новую страницу.

C++ ?
Java

Shorty(Ale Chapa) Manskiy
08.06.2017
17:25:05
Java-сообщество не осилило?

Илья
08.06.2017
17:26:32
https://regex101.com/r/WmZxwp/9 - во какой капец
Слушай, а ведь работает же вроде. ?

Страница 292 из 1551