Русский язык. Цифровизация предлогов.

1 месяц назад от Ольга Свириденко

1 ответ



0 голосов
Да ничего не даёт. Векторизатор НС хранит слова в виде векторов, схожесть или различия между словами будут вычисляться через величину косинуса угла между этими векторами (так называемое косинусное расстояние) , у самых примитивных моделей - в виде мешка слов (где одному слову сответствует один индекс) . Такая цифровизация, как здесь, не имет смысла, потому что:

Цифровизированы только предлоги (цифровизировать таким образом все слова языка не получится - слишком много категорий и разрядов, нет никаких общих правил для подобной классификации, которые смогли бы сделать её хоть сколь-нибудь осмысленной)
У одних и тех же предлогов в зависимости от контекста могут быть разные значения (что осложняет ручную разметку)

Ну и главное - нейросеть спокойно обучится без искусственного вмешательства со стороны человека. Свёрточная НС сама сделает примерно такую же классификацию, но без ненужных усложнений.
1 месяц назад от BlytheVosbur

Связанные вопросы