Влод
А ещё (мне человеку отдаленному) корпус звучит так как будто есть единый формат хранения корпусов
Oleksandr
Нету) но это не проблема
Влод
Как будто тебе кинут прогу и ты сразу туда корпус
Oleksandr
Ну конвертнуть придется, как всегда
Oleksandr
Вообще 80% датасаенса это конверторы)) если на практике
Oleksandr
Чистка датасетов, какие-то преобразования, нормализация, дебиасинг итд
Влод
вспомнил. https://api.ai/ вот такую штуку на работе использовали. Дурацкая вещь на самом деле - парсер как сервис. Кто-то умелый видимо смог продать это организации. Ну и сейчас задумался как у тебя может выглядеть корпус. Скорей всего там либо перечилсены все варианты предложений с плейсхолдерами под даты, время и тд. Либо она уже представлена в bnf. в обоих случаях там должно быть очень большое описание чтобы не взяться за написание парсера вручную
Oleksandr
Корпус это вообще то что люди вводили
Oleksandr
То что не попало под рукописную грамматику в частности
Oleksandr
Так что там нету ни бнф ни плейсхолдеров, в том-то и дело
Oleksandr
Кстати, а чем плох парсер как сервис?
Влод
Кстати, а чем плох парсер как сервис?
тратить деньги на то что мобилка могла бы и сама осилить. лишняя задержка для пользователя.
Влод
ну ты можешь подумать что там же предоставляется и спич рекогнайзер, но нет. это был отдельный сервис
Oleksandr
Oleksandr
не говоря уже об доучивании
Oleksandr
у простенького стэнфорд парсера которому сто лет в обед - моделька для одного английского языка весит больше гига
Oleksandr
гугл для транслейта очень гордился тем что смог ужать пару EN-DE в менее 200 метров, чтобы сделать офлайновый
Oleksandr
ну и тд
Влод
короче я не уверен что контекстно-свободные языки гарантируют однозначность вывода. если не гарантируют то нужна моделька для вывода. но так до этого я подразумевал обычные детерменированные парсеры как в языках программирования. понятно что для норм нлп это не годится но для тупого бота пойдёт
Влод
кстати вообще не имею представления насколько тупые/умные у гугл транслейта механизмы. ну то есть наверное кроме слов, нейронок обученных на предложениях есть ещё какое то знание о языковой модели
Oleksandr
и например Earley парсеры парсят такое нормально, выдавая разные варианты
Oleksandr
у ГТ механизмы менялись from scratch уже раз 10 наверное
Oleksandr
в блогах писали
Oleksandr
в комьюнити всяких переводчиков бывают батхерты на эту тему)
wystan_hugh
Вечер в хату, кодеры и кокодеры
Ilya
Где в этот раз ссылку запостили?:)
Alexander
В чате про зависимые типы 😬😬☺️☺️
Artem
++ дайте ссылку
Alexander
Invite link: https://t.me/joinchat/AAAAAD9SWO-kmHf9o6Cn-Q
Alexander
Ну идея что пойдут те кому интересно
Alexander
Dmitry
а кто-нибудь щупал propellor ?
Dmitry
когда я его последний раз смотрел, он умудрялся не работать на базовых кейсах. но после этого чувак выступал на каких=то эвентах, продвигал его
Dmitry
может, оно живое.
Dmitry
или лучше научиться nix для деплоймента - алсо, кто=нибудь так делает?
Dmitry
все таки не люблю ansible, прям мутит каждый раз когда надо опять его использовать.
Alexander
У нас делают, но я не умею
Alexander
Точнее у нас адищще мы никсом генерим rpm репу, а дальше с нее обновляется
Alexander
Но скрипты обновления это чужое legacy
Dmitry
казалось бы, rpm это как раз тот ад, от которого должен был избавить nix
Alexander
Ну там огромная инфраструктура на рпм
Alexander
Нам бы не дали ее менять
Alexander
Но тут получилось что есть и старая инфраструктура и бонусы от никса
Dmitry
ну ладно, но все таки - кто как еще деплоится?
Dmitry
в перспективе надо бы еще и виртуалки оркестрировать
Alexander
Паппет : (
Dmitry
в пропеллоре кстати какое-то колыхание наблюдается, т.е чел не забил
Dmitry
меня удручает, что весь этот "деплоймент" можно нафигачить на баше или туртле - возможно, быстрее чем разбираться с остальным
Alexander
Вот есть такое дело, у меня с новыми технологиями вообще проблемы
Alexander
В смысле что я частотные понимаю нафига оно
Dmitry
хаха нет
Dmitry
ну и не решает
Quet
а чо нет? удобно вроде
Dmitry
про докер в продакшене тут прям надысь был знатный срачь
Dmitry
да не вижу как он поможет
Quet
ссылку?
Dmitry
сейчас
Quet
ну как, собираешь в одном месте, разливаешь образы по машинам
Dmitry
https://thehftguy.com/2016/11/01/docker-in-production-an-history-of-failure/
Dmitry
раз
Dmitry
https://medium.com/@demeliorator/docker-in-production-a-cargo-cult-and-the-rise-of-church-of-metrics-b0472148d939#.o1cpmr1sb
Dmitry
два
Quet
почитаю у меня чёт граблей с ним почти и не было
Quet
с сетью было давно ещё
Dmitry
но в данном случае мне ближе позиция первого чувака. т.е докер да, решает, как зависимостями какого-нибудь рубипитонапхпапачамускула
Dmitry
не засрать напрочь всю систему
Dmitry
но у нас с хаскеллем в условиях выпиленной СУБД проблемы совсем другие
Dmitry
в общем случае их да, решает ансибль, но уж больно он мерзкий
Quet
ну и вообще если динамически линкуешься с чем-то то помогает
Dmitry
ну и не атомарный и не идемпотентный
Quet
ансибл работает но ебучие yml эти
Quet
на которых логику писать
Dmitry
в нашем случае проблема была только с libgmp на старом дебиане
Dmitry
ну вот еще обламывает неатомарность
Quet
никс попробуйте но кажется оно сырое