Skip to content

Latest commit

 

History

History
9 lines (7 loc) · 1.29 KB

File metadata and controls

9 lines (7 loc) · 1.29 KB

EzChatBot

Бот основанный на кодировке слов с помощью CountVectorizer и сходства текстов с помощью косинусного расстояния Принцип очень простой: пользователь отправляет сообщение , мы его чистим от знаков препинания и приводим к нижнему регистру с помощью обученного CountVectorizer на тренировочных вопросах мы кодируем вопрос пользователя и затем просто проходимся по массиву вопросов которые у нас есть, считаем косинусные расстояния и выдаем ответ соответствующий вопросу который имеет самое большое косинусное расстояние с вопросом пользователя. Конечно этот способ очень спорный т.к. слова с разными окончаниями будут восприниматься как разные и еще несколько проблем есть,но всё же для первого раза думаю пойдет.

Дальше больше:)