vitus_wagner: My photo 2005 (Default)
[personal profile] vitus_wagner
https://betanews.com/2017/05/04/google-open-source-raspberry-pi-diy-voice-kit/

Гугль начал торговать набором на базе Raspberry PI для встраивания голосового управления во всякие самоделки. Правда, хотя в новостях на слешдоте и утверждается что "it can run completely on-device" я более детальных ссылок как это сделать без обращения к гугловским API не нашел.

Ну в общем-то хрен с ним с гуглом. В любом случае использованипе отдельного интерфейса из микрофона и динамика и отдельного процессора на каждом устройстве, куда прогрессивнее чем управление устройством со смартфона через внешний сервер.

Date: 2017-05-05 08:19 am (UTC)
From: [personal profile] qwe_rty
Настоящий прогресс наступит тогда, когде какой-нибудь Skyworks сделает модуль низкого энергопотребления размером с копейку, в котором будет интегрировано все необходимое для голосового управления, и выпустит его массовым тиражом. Ждать осталось, небось, пару лет.

Date: 2017-05-05 08:24 am (UTC)
livelight: (Default)
From: [personal profile] livelight
Они же SkyNet делают? Голосовой модуль понадобится для терминаторов, а это уже следующий этап.

Date: 2017-05-05 08:29 am (UTC)
From: [personal profile] qwe_rty
Нет, они делают полуаналоговые устройства типа радиоусилителей, используемых в WiFi и мобилах, выделение голоса из шума и т.п. Распознавания голосовых команд у них нет - небось, на патентах сидит задницей Гугель или еще кто.

Date: 2017-05-05 08:37 am (UTC)
livelight: (Default)
From: [personal profile] livelight
Полагаю, SkyNet положит болт на патентное право :)

Date: 2017-05-05 08:43 am (UTC)
From: [personal profile] qwe_rty
И это хорошо. Слава роботам!

Date: 2017-05-05 10:02 am (UTC)
ext_1262629: (Default)
From: [identity profile] cats-shadow.cats-home.net
Хм. Любопытно, да.
Образ диска в свободном доступе. Надо глянуть что там по железу на их Voice HAT accessory board и 2 Voice HAT microphone board (или вдруг где схемы есть).

Date: 2017-05-05 11:10 am (UTC)
ext_1262629: (Default)
From: [identity profile] cats-shadow.cats-home.net
Как я понял из беглого осмотра -- там андроид поднимается на RPI3. На нормальном компе -- разве что в эмуляторе.
В принципе, могу образ записать и глянуть, что там.
From: [personal profile] fhunter
Есть такая штука - respeaker - там openwrt запущенный на mediatek mt7688 + опционально - 7 микрофонов и DSP который выделяет речь, определяет направление на говорящего и гасит эхо. (Микрофоны - просто USB звуковая карта, так что можно использовать отдельно).
У меня на столе сейчас лежит, но руки полноценно потестировать пока не дошли.
Схемы этого всего есть. Насколько хватит 600МГц MIPS процессора на то, чтобы делать нетривиальное распознавание речи - не знаю.

По софту - вроде бы там pocket sphinх для распознавания, а вот что для синтеза речи - с ходу найти не могу.

Profile

vitus_wagner: My photo 2005 (Default)
vitus_wagner

September 2017

S M T W T F S
     1 2
3 4 5 6 789
1011 121314 1516
171819 20 2122 23
24252627282930

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 25th, 2017 04:49 pm
Powered by Dreamwidth Studios