Как гугл научился распозновать голос и изображение?

5 года назад от Адина Жабарова

1 ответ



0 голосов
Для компьютера голос (т. е. звук) и изображение, это всего лишь набор (последовательность, чередование) единиц и нолей. То есть, некий цифровой код. Задача сводится к написанию программы, которая будет сравнивать поступающий код с каким-нибудь другим, уже имеющимся в памяти компьютера (образец, эталон и т. п. ) . Например, достаточно занести в память, образец речи со словами - "Окей Гугл ответы мейл ру категория техника", и привязать этот образец к переходу на сответствующий сайт. Особенности произношения, например тембр голоса, нивелируются фильтрами в программе. То есть, кто бы не говорил, мужчина, женщина или ребенок, компьютер приведет речь к какому-то усредненному варианту.
Примерно то же самое и с распознаванием, и последующим поиском, картинок.
5 года назад от Макс Захаров

Связанные вопросы

1 ответ
7 года назад от вера еккерт
3 ответов
13 года назад от Татьяна Речкалова