vitus_wagner | По-моему, пора

Entry tags:

По-моему, пора

Организовывать стартап по разработке и запуску в производство очков a-la шумиловский дракон. Торговая марка DragonGlasses.
Все необходимые компоненты уже вроде как в производстве, включая Нейро-импульсный активатор в качестве устройства ввода.

Осталось впихнуть все это дело в налобный обруч.

Спецификация примерно такая:

1. Два экрана (не менее чем 800x600) вмонтируемые в стекла очков. Экран должен уметь работать на просвет и со встроенной подсветкой.
2. Две видеокамеры (возможно дополнительная пара для работы в инфракрасном диапазоне)
3. Наушники.
4. Микрофон от телефонной гарнитуры.
5. NIA в качестве устройства ввода.
6. GPS
7. GPRS-модуль. Впрочем всвязи с грядущим переходом на всякие 3g, может быть имеет смысл GRPS не встраивать, а поставлять как SD-карточку
8. Штук восемь полноразмерных SD-слотов. Естественно, с поддержкой HC. Чтобы этак 256Гб storage напихать можно было.
По крайней мере два из этих слотов должны поддерживать не только память, но и всякие прочик устройтсва вроде модемов.
9. Встроенный storage 4-8Гб, больше не надо.
10. Памяти и процессора много не надо, примерно на уровне N800. Время работы от аккумулятора - важнее.
12. Снаружи весь обруч покрыт солнечной батареей.
13. Bluetooth
14. Насчет wi-fi - не уверен. Больно уж излучаемая мощность велика, чтобы на голове держать. может лучше в качестве аксессуара поставлять Wi-Fi - PAN bridge.

Flat | Top-Level Comments Only

С программной все много хуже. Производительность существующих интерфейсов примерно на порядок ниже той, что описывает Шумил. Те действия, которые у его героев занимают секунды и минуты, у меня занимают десятки минут и часы. Это связано с пропускной способностью интерфейса, которая только понизится в отсутствие текстового ввода, и с негодностью имеющихся структур данных. В настоящее время, эту проблему решают созданием специализированных интерфейсов под каждый вид деятельности, эффективно пользоваться которыми надобно учиться. Эту проблему придется как-то решать: либо создавать под очки кучу интерфейсов для всех случаев жизни: от инженерных изысканий, до спортивной навигации, либо изобретать концепцию, в рамках которой можно будет оперировать с любыми данными. И то и другое само по себе задачи для отдельного стартапа. Поэтому, ИМХО, очки не смогут работать в качестве "усилителя разума". Остается их применение в качестве "усилителя памяти". Тут все выглядит вполне реальными, вопрос только в том, откуда брать данные в "концентрированной" форме, поскольку только их через такой интерфейс и удастся воспринимать. Боюсь, что навигация по вебу, даже по википедии, будет неэффективна.

ИМХО, девайс перспективный. Эффективно спроектировать в железе (а не накидать модулей в кучу) я такой вряд ли смогу, но софтверной частью, я бы занялся с удовольствием. Собственно, когд кто-нибудь выпустит такой девайс в виде более менее открытой платформы, и так займусь.

так значит разрабатывать програмную часть можно уже сейчас... а аппаратная очень даже подтянется

например появление мультияжерного процессора типа Cell для супермобильной платформы, это дело следующих лет 5, а на самом деле даже меньше. (инженерный образец и сейчас возможно сделать, просто он никому не нужен, да и дороговат пока)

так что ловлю на слове "но софтверной частью, я бы занялся с удовольствием." ;) какие есть идеи. ведь програмного эмулировать подобный девайс можно уже сейчас.

Дело не в производительности процессора, а в потребляемой энергии. С этим пока не очень: аккумуляторы слабые, КПД солнечных батарей низкий, а энергопотребление высокое. Что толку от мультиядерного процессора, если он жрет как танк.

Про софтверную часть я могу только в общем виде рассказать, без конкретных примеров. Для начала, исходные посылки:
1. Низкая пропускная способность интерфейса в направлении от человека к машине (сравнима с современной мышой.

2. Несколько неспециализированных входных каналов (2 камеры, микрофон, GPS, гироскопы и т.п.) Для такого устройства это не просто внешние гаджеты, как камеры на ноутбуках, а части внутренней логики.

3. Довольно специализированный выходной канал (очки) требующий специальной проработки интерфейса. Пользователь будет очень обижен, если в критический момент обзор будет закрыт message box'ом.

Кстати, у драконов изначально очки были просто защитными очками с функцией навигатора. Это уже потом догадались в качестве коммуникатора.

Исходя из ограничений, ясно, что текстовый ввод (от CLI до поисковых запросов) непригоден. Средства речевого ввода до сих пор находятся в поганом состоянии и для промышленного применения практически непригодны. Остается курсорное управление. Интерфейс можно организовать в иерархическое меню. Меню распространены уже лет 20, но много вы видели удобных? Соответственно меню должно иметь возможность (само)организоваться под потребности пользователя. Наибанальнейший пример: панель быстрого запуска и список часто используемых команд в винде и история командной строки в линухе. Здесь можно пойти дальше и устроить полностью самоорганизующееся иерархическое меню на основании связей между категориями команд и частоты запуска.

Из-за низкой пропускной способности канала, управление устройством должно быть декларативным. Пользователь говорит "get online", в девайс сам определяет способ, которым он может вылезти в сеть. Основная проблема юзабилити современных девайсов ― идиотское меню, которое ни разу не декларативно. В примитивном варианте пользователь сможет описывать свои команды на языке программирования или устанавливать готовые модули. В идеале, он сможет программировать устройство на лету.

До сих пор это был уровень hands-free PDA. Поскольку устройство имеет пучок каналов предоставляющих информацию о реальном мире, они тоже должны быть интегрированы в интерфейс. Вот тут-то и начинается самое интересное. Устройство должно уметь понимать в какой точке оно находится и как ориентировано в пространстве. Это позволит выдавать пользователю информацию о реальном мире. Где повернуть, в какую сторону выход с платформы, как проходит силовой кабель или крупный нервный пучок, чья рожа в пятом ряду кажется знакомой. Хотя бы вывести текстовую информацию на фоне подходящей поверхности. Для этого устройство должно уметь распознавать образы. Двух камер достаточно, чтобы оценивать расстояния и строить 3D модели реальности. Сопоставлять их с имеющимися данными, вполне реальная задача. Для распознавание таких элементов, как лица, вывести, части тела, штрихкоды и т.п. потребуются отдельные модули, алгоритмы для которых уже существуют.

Итого: самоорганизующеся иерархическое меню, декларативное управление и интерфейс, основанный на реальном мире. Для первых двух достаточно эмулятора, а для третьего потребуется инженерный образец.

///Что толку от мультиядерного процессора, если он жрет как танк.

Потребление прямо зависит от рабочей частоты (сейчас есть процы потребляющие считаные ваты при частоте меньше гигагерца) и токов утечки обеспечиваемых текущей технологии.
А сами по себе микросхемы штука очень токая (даже в виде пленок можно делать) и энергоэффективная (побороть токи утечки не есть невозможное)

Так что, перспектива есть.
А думать как заюзать мультиядерность можно и нужно думать уже сейчас. Потому как например описанные вами задачи вполне могут выполнятся паралельно...

///1. Низкая пропускная способность интерфейса...

А зачем там большая?? Дай бог чтобы устройство с такой как есть нормально справлялся.

///2. Несколько неспециализированных входных каналов ... части внутренней логики.

не объязательно. Зависит от способа применения.
если например вывод с камер будет использоватся как способ показать "а сейчас я вот здесь" друзьям, то тут только банальные ограничения пропускной способности имеют значение.

Какие-то более навороченные способы использования? Да пусть люди хоть к тем что попроще попривыкнут...

\\\3. Довольно специализированный выходной канал (очки) требующий специальной проработки интерфейса.

Дык... на то я вам и предлагаю... поразмыслить на тему более удобного интерфейса. С его первоначальной чисто програмной эмуляцией. Смотриш, такие наработки и обычный существующий интерфейс помогут улучшить.

\\\Исходя из ограничений, ясно, что текстовый ввод непригоден.

Почему?
Существуют ведь образцы клавиатур в виде перчаток -- текст набирается пальцами одной руки. Не говоря уже об ускорителях набора на которых разработчики мобилок собак поели. Ведь не Войну и Мир набирать...
А если будет еще и возможность считывания хотя бы простых жестов -- этого будет ИМХО вполне достаточно.

\\\Средства речевого ввода до сих пор находятся в поганом состоянии и для промышленного применения практически непригодны.

Всего лишь требуют тонкой настройки на пользователя. Но это ведь только дополнительный уровень секьюрити :) Да и использоватся должен для чего-то важного, типа формулировки задачи, а не для перемещения курсора (в чем и есть главная проблема текущих реализаций -- из пушек по воробьям, да еще и бронебойными :)) ).

\\\Соответственно меню должно иметь возможность (само)организоваться под потребности пользователя.

Здесь поподробнее...

\\\Из-за низкой пропускной способности канала, управление устройством должно быть декларативным.

Не совсем понятно. Да и не похоже это на действительное решение. Скорее на обычное противопоставление "умных програмистов на Лиспе" против "глупых на Фортране"...
То что управление должно основыватся на живом языке, а не на его обрезаном подмножестве -- это да. Но это никак не декларативность...

\\\Пользователь говорит "get online", в девайс сам определяет способ, которым он может вылезти в сеть.

Вот это я и называл выше "из гаубицы по тараканам" :)
Подобного рода таски должны отслеживатся устройством самостоятельно, без всякого участия пользователя... максимум -- сообщение о готовности к работе.

\\\В идеале, он сможет программировать устройство на лету.

Хотелось бы конкретные идеи на эту тему.

\\\Устройство должно уметь понимать в какой точке оно находится и как ориентировано в пространстве. Это позволит выдавать пользователю информацию о реальном мире.

Это уже более прогдвинутый функционал.
Да и... при наличии постоянной связи может быть отдан на откуп большим онлайновым сервисам.
Отсылаеш ему инфу о текущем положении, картинку, а он уже там у себя на основе своей широченной базы и огромныз выч. ресурсов анализирует. Зря что ли Гугл стараестя? ;)

\\\Для первых двух достаточно эмулятора, а для третьего потребуется инженерный образец.

дык... дело за эмулятором.

а для третьего, тоже не объязательно.
можна обкатать в мирах виртуальной реальности.
например в чем-то типа Second Life

Эй!!!... да вообще, такого типа устройства вполне можно не только разрабатывать, но и производить и продавать виртуально... тем же пользователям подобных виртуальных миров. А потому уже и в реал... ;)

При равном техпроцессе, потребление зависит от рабочей частоты И количества 'работающих' транзисторов. То есть, например, АРМ на 312 МГц будет потреблять на порядок-два меньше, чем пентиум(два) сходной частоты. То есть, разумно применяя правильные (заточенные под конкретную задачу) сопроцессоры можно добиться снижения энергопотребления в 10-100 раз.

Виртуальная клавиатура (в виде напальчника-перчатки) мне кажется удачным решением.

По поводу железа - Есть дофига разных микросхем программируемой логики, причем в виде готовых плат и по сравнительно доступным ($200-$2000) ценам. Двухсотбаксовая, например, позволяет собрать что-нибудь типа "MIPS32, 25 МГц, 16Мб рам" с кучкой спецсопроцессоров, причем весь проект описывается на паскалеобразном языке и может быстро и легко модифицироваться.
Вот (http://www.plis.ru/page.php?id=134), например, одна из готовых отладочных плат. Навскидку, ее возможностей достаточно для данной задачи.

на самом деле для восстановления 3D достаточно одной камеры, поскольку человек находится в движении работают алгоритмы "синтеза апертуры". Кроме того это очень мощный источник координат и автокартирования окружающей владельца "очков" местности.

Производительность существующих интерфейсов примерно на порядок ниже той, что описывает Шумил.

Вот для этого и нужен NIA. По отзывам пользователей данного устройства время реакции при некоторой тренировке доводится до 1/50 секунды. Поэтому неисключено что с помощью NIA можно вводить текст на экранной клавиатуре со скоростью слепого десятипальцевого метода. Или придумать еще более эффективный метод ввода.

Flat | Top-Level Comments Only

По-моему, пора

no subject

а софт?

Re: а софт?

Re: а софт?

Re: а софт?

Re: а софт?

no subject