vitus_wagner: My photo 2005 (Default)
[personal profile] vitus_wagner
https://betanews.com/2017/05/04/google-open-source-raspberry-pi-diy-voice-kit/

Гугль начал торговать набором на базе Raspberry PI для встраивания голосового управления во всякие самоделки. Правда, хотя в новостях на слешдоте и утверждается что "it can run completely on-device" я более детальных ссылок как это сделать без обращения к гугловским API не нашел.

Ну в общем-то хрен с ним с гуглом. В любом случае использованипе отдельного интерфейса из микрофона и динамика и отдельного процессора на каждом устройстве, куда прогрессивнее чем управление устройством со смартфона через внешний сервер.

Date: 2017-05-05 08:19 am (UTC)
From: [personal profile] qwe_rty
Настоящий прогресс наступит тогда, когде какой-нибудь Skyworks сделает модуль низкого энергопотребления размером с копейку, в котором будет интегрировано все необходимое для голосового управления, и выпустит его массовым тиражом. Ждать осталось, небось, пару лет.

Date: 2017-05-05 08:24 am (UTC)
livelight: (Default)
From: [personal profile] livelight
Они же SkyNet делают? Голосовой модуль понадобится для терминаторов, а это уже следующий этап.

Date: 2017-05-05 08:29 am (UTC)
From: [personal profile] qwe_rty
Нет, они делают полуаналоговые устройства типа радиоусилителей, используемых в WiFi и мобилах, выделение голоса из шума и т.п. Распознавания голосовых команд у них нет - небось, на патентах сидит задницей Гугель или еще кто.

Date: 2017-05-05 08:37 am (UTC)
livelight: (Default)
From: [personal profile] livelight
Полагаю, SkyNet положит болт на патентное право :)

Date: 2017-05-05 08:43 am (UTC)
From: [personal profile] qwe_rty
И это хорошо. Слава роботам!

Date: 2017-05-05 10:02 am (UTC)
ext_1262629: (Default)
From: [identity profile] cats-shadow.cats-home.net
Хм. Любопытно, да.
Образ диска в свободном доступе. Надо глянуть что там по железу на их Voice HAT accessory board и 2 Voice HAT microphone board (или вдруг где схемы есть).

Date: 2017-05-05 11:10 am (UTC)
ext_1262629: (Default)
From: [identity profile] cats-shadow.cats-home.net
Как я понял из беглого осмотра -- там андроид поднимается на RPI3. На нормальном компе -- разве что в эмуляторе.
В принципе, могу образ записать и глянуть, что там.
From: [personal profile] fhunter
Есть такая штука - respeaker - там openwrt запущенный на mediatek mt7688 + опционально - 7 микрофонов и DSP который выделяет речь, определяет направление на говорящего и гасит эхо. (Микрофоны - просто USB звуковая карта, так что можно использовать отдельно).
У меня на столе сейчас лежит, но руки полноценно потестировать пока не дошли.
Схемы этого всего есть. Насколько хватит 600МГц MIPS процессора на то, чтобы делать нетривиальное распознавание речи - не знаю.

По софту - вроде бы там pocket sphinх для распознавания, а вот что для синтеза речи - с ходу найти не могу.

Profile

vitus_wagner: My photo 2005 (Default)
vitus_wagner

May 2017

S M T W T F S
  12 3 4 5 6
7 8910 11 12 13
1415 1617 18 1920
2122 23 24 25 2627
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 27th, 2017 03:42 pm
Powered by Dreamwidth Studios