Ayrat
и я не уверен что там они оперируют вероятностями
Hog
нагуглил :)
Romɑn
и я не уверен что там они оперируют вероятностями
Но, да. В общем Леха отдает вероя тность, что это имя. А я хочу понять, надо ли мне искать вероятность, что этот аркайди имеет такое имя.
Romɑn
Но, я нашел способ убрать расстояние ливенштейна или обогатить его до вероятности.
Ayrat
Вопрос к знатокам теорвера. Есть кусок текста, с вероятностью, что это какое-то имя. Мне он приходит извне. Типа "value: "pole", probabiltyThatItsAName : 0.7835" . У меня есть серивис который сопоставляет имя и выдает вероятности с айдишником. Правильно я понимаю, что перемножу вероятности и получу вероятность того, что это слово имеет айдишник?
давай пример "abc123" сервис1 говорит что это ВЕРОЯТНО имя "abc" с вероятностью 0.75 "cba" с вероятностью 0.25 сервис2 говорит что если это ИМЯ "abc, то ВЕРОЯТНО что у него ID "arkId15" с вероятснотью 0.90 "arkId4567567" с вероятснотью 0.10 А если это ИМЯ "cba, то ВЕРОЯТНО что у него ID "arkId8966" с вероятснотью 0.50 "arkId444" с вероятснотью 0.50 так?
Romɑn
https://ru.wikipedia.org/wiki/%D0%A1%D1%85%D0%BE%D0%B4%D1%81%D1%82%D0%B2%D0%BE_%D0%94%D0%B6%D0%B0%D1%80%D0%BE_%E2%80%94_%D0%92%D0%B8%D0%BD%D0%BA%D0%BB%D0%B5%D1%80%D0%B0 Это ещё не вероятность, но корреляция
Ayrat
если так, то да, можно сказать что "abc123" является ID "arkId15" с вероятностью = 0.75 * 0.90 "arkId4567567" с вероятностью = 0.75 * 0.10 "arkId8966" с вероятностью = 0.25 * 0.50 "arkId444" с вероятностью = 0.25 * 0.50
Romɑn
если так, то да, можно сказать что "abc123" является ID "arkId15" с вероятностью = 0.75 * 0.90 "arkId4567567" с вероятностью = 0.75 * 0.10 "arkId8966" с вероятностью = 0.25 * 0.50 "arkId444" с вероятностью = 0.25 * 0.50
И тогда, получается супер сервис. Я уже (и без вероятностей) накидываю в инхэбит прототип, по показу минифактивов в статье прям по наведению на имя игрока.
Romɑn
Или клуба
Romɑn
O_O
Одно его брэндировать и вот тебе новый продукт
Anonymous
что я так и не понял что там завероятности
Anonymous
три раза перечел
Anonymous
что за магия такая?
Romɑn
Арк айди по имени есть. Инфо по аркайди из сдн скачал и карточку показал
Romɑn
что за магия такая?
Ты просто вне контекста
Anonymous
как и главное зачем айдишники с вероятностью?
Romɑn
Айрат в курсе)
Ayrat
как и главное зачем айдишники с вероятностью?
проблема преобразования текста в сущности
Ayrat
например Spartak FC Спартак Москва спартак ФК и всё это должно вести в team_15
Romɑn
проблема преобразования текста в сущности
У большинства слов вероятность будет низкая. Так что ставим ограничение (вычисляемое эмпирическим путем) и делаем сервис. Леха уже справился с сущностями
Ayrat
или там сппртак FC
Ayrat
опечатки тоже должны вести к team_15
Ayrat
но уже с вероятностью
Anonymous
так это баесов классификатор
Anonymous
обычный
Anonymous
нет?
Romɑn
опечатки тоже должны вести к team_15
Опечатки по джаро Винклер у определяются
Romɑn
Но спасибо, похоже.
Romɑn
Но он больше для классов которых не много, а тут много классов
Romɑn
Но он больше для классов которых не много, а тут много классов
Хотя я вру. Надо перечитать. Про байесовскую модель
Anonymous
не
Anonymous
ты не прав
Romɑn
Romɑn
Там как раз вероятностями оперируют
Anonymous
это баесов классификатор чистой воды
Anonymous
может, там декорации какие нужны, но я уже не силен в этом
Romɑn
Но у меня не будет статистики, поэтому может и ее собирать надо. Посмотрим, в любом случае спасибо можно глянуть
Anonymous
в смысле не будет?
Anonymous
ты сам статистку прислал
Anonymous
или у тебя правильных ответов нет?
Romɑn
Но, можно собирать.
Anonymous
возьми метрику эвклидову, напримре. посчитай растояния
Anonymous
k-ближайших соседей
Anonymous
алогритм кластеризации
Anonymous
и вуаля
Anonymous
есть статиска
Anonymous
это, конечно, не панацея, но как первое решение вполне поедет
Anonymous
дальше уже мозги включать надо
Romɑn
есть статиска
Да, посмотрим. В любом случае я смотрю на уровне продукта пока. Его ключевых фич. Если собирать статистику, то байесовский классификатор годный.
Romɑn
Посмотрим можем ли мы не собирать статистику.
Андрей
если это та про которую он говорил что пишет продолжение, то должна быть для начинающих? нет доверия переводам...
Anonymous
да статистику тебе алгоритм кластеризации даст
Anonymous
че ты
Anonymous
это мэйнстрим
Romɑn
да статистику тебе алгоритм кластеризации даст
Для кластеризации нужно всеравно собирать информацию. Я пока хочу этого избежать
Anonymous
он тебе выдаст n решений, на каждом шаге. прогонишь по всем, найдешь тот, где ошибок поменьше
Anonymous
если лейблов нет, то тут только у Бога спрашивать, либо кластеризовать
Анна
если это та про которую он говорил что пишет продолжение, то должна быть для начинающих? нет доверия переводам...
Не знаю, про какую говорил, но я пока полистала первые главы, и для начинающих будет норм. А перевод отредактирован и одобрен Брагилевским
Anonymous
есть тема с метриками. их доебища разных. эвклидова самая триваильная, но не факт, что самая подходящая.
Romɑn
Пока можно обойтись перемножением вероятностей и трешзолжом по итогам. Если не пойдет добавить кнопку, что это решение ошибочно. Потом доработать. Аджайл
Anonymous
да это методом тыка
Hog
грёбаный SalesForce 😭
Anonymous
"Жизнь науке дала хуй в руке" в этом вопросе пока что.
Андрей
в одном подкасте он ее хвалил и грил что сам пишет еще одну для продолжающих
Romɑn
@omgszer можно ли как-то сохранить контекст ажурной ф-ции? чтоб не выкачивать игроков каждый раз? это самамя долгая операция в пайплайне сейчас
Ayrat
пока инстанс не сдохнет, статик будет жить
Ayrat
если сдохнет, извини, магии не будет, надо будет вычитывать из стораджа
Romɑn
static
И она на каждый вызов ажурной ф-ции будет, сохранена? Не верю в это, ТК делали тесты с соседних компов. :(