Интервью с Натаном Смитом, который возглавляет в Amazon команду разработки новых функций умного дома для помощника Alexa
Аналитики прогнозируют рост спроса на рынке устройств для умного дома. Пользователи все больше привыкают к умным гаджетам и доверяют им все больше бытовых задач.
В компании Amazon, которая в прошлом году запустила API для взаимодействия со своим умным помощником Alexa, видят большие перспективы в развитии этого направления. Сегодня Alexa может управлять умным домом, например закрывать ворота, включать и выключать освещение, взаимодействовать с камерами наблюдения и так далее. Одно из важных направлений в разработке помощника — сделать голосовое управление более естественным, чтобы клиент мог давать команды в произвольной форме, как будто общается с другим человеком.
Портал VentureBeat взял интервью у Натана Смита, который руководит отделом разработки новых smarthome-функций для Alexa, и обсудил с ним принципы, по которым компания развивает возможности помощника и совершенствует пользовательский опыт.
VentureBeat: Думаю, мы могли бы начать с общего обзора подхода Amazon к технологиям умного дома и голосового управления, а потом углубиться в некоторые идеи, которые вы и ваша команда реализуете, для того чтобы упростить управление подключенными устройствами с помощью Alexa. Хорошо?
Натан Смит: Конечно. Мы считаем, что сейчас для технологии умного дома настало время массового внедрения и расширения. Классическими пользователями технологии всегда были передовые в техническом плане клиенты, но эти времена уже прошли. Сегодня существует более 60 000 продуктов от 7400 различных производителей, которые работают с Alexa, и мы наблюдаем тенденцию к тому, что Alexa упрощает контроль над этими устройствами.
Одна из вещей, которые меня больше всего порадовали в этом году, — это новая функция, использующая машинное обучение и искусственный интеллект, чтобы помочь Alexa понимать не только то, что вы говорите, но и то, что вы на самом деле имеете в виду, а вместе с этим и упрощать пользовательский опыт.
Проблема, которую мы решаем, была выявлена благодаря отзывам клиентов, некоторые из которых забывали имена умных устройств в своем доме. Мы неоднократно сталкивались с этим: люди не помнят, как обращаться к тому или иному устройству. Ситуация усугубляется тем, что в доме появляется все больше и больше подобных гаджетов.
По сути, мы сделали Алексу чуть более похожей на человека. Если вы скажете ей что-то вроде «Привет, Алекса, включи диванный свет», имея в виду, что нужно включить свет в гостиной, то Алекса услужливо предложит: «О, наверное, вы имели в виду свет в гостиной?»
Эта технология позволяет людям давать команды более небрежно и не придерживаться строгого синтаксиса, как раньше. Это может быть полезно в различных реальных случаях использования. Например, когда слова имеют похожую транскрипцию или если в именах контактов или устройств присутствуют смешанные символы вроде смайликов. Также Алекса может понимать слова, не требуя идеального произношения. Это может помочь в случаях использования нескольких языков. Если вы используете сочетание имен на разных языках, Alexa с этим тоже справится.
Суть в том, что мы пытаемся научить Алексу понимать вашу естественную речь, а не заставлять людей говорить удобным для машины языком. Если у нас есть достаточно хорошее представление о том, что вы говорите, мы просто выполняем поставленную задачу. Однако наша цель — создать модель, в которой Alexa распознает суть получаемых задач. С одной стороны, мы не хотим отвлекать внимание клиентов, задавая уточняющие вопросы, если мы не уверены на 100% в чем-то, но мы также хотим, чтобы Alexa была полезна в неоднозначных случаях.
Мы начали внедрять эти функции в США в конце декабря и недавно расширили их для Канады, Австралии, Великобритании и Индии. Что касается предварительных результатов, клиенты принимают уточнение Алексы в среднем в 80–90% случаев.
VentureBeat: Какие еще факторы учитывает Alexa при решении того, как реагировать на команду, как она понимает, оговорился человек или нет?
Смит: То, что лежит в основе машинного обучения Алексы, очень похоже на то, как учится ребенок: задавая вопросы об окружающем мире, он собирает основополагающие истины и ассимилирует их в семантические и поведенческие модели. По сути, наши модели сопоставляют машинные сигналы устройств и естественные и поведенческие сигналы. Например, информация о том, когда и какие устройства обычно включены, дополняет сигналы окружающей среды, такие как дата и время. Все это модели используют для создания предложений.
Нам предстоит еще много работы, и мы думаем, что у нас получится расширить сценарии использования подобных полезных функций. Мы видим, что все больше и больше клиентов из разных слоев общества и с разным уровнем технологической подкованности используют устройства умного дома вместе с Alexa. Это первый шаг к внедрению передовых технологий и их использованию для упрощения пользовательского опыта.
VentureBeat: ИИ и машинное обучение, очевидно, лежат в основе работы Alexa на самых разных стадиях — от обработки и понимания речи до того, как правильно ассоциировать команды и нужный навык помощника. Какие еще проблемы вы и ваша команда решаете с помощью ИИ? И чего это позволило вам достичь?
Смит: На уровне функций есть так называемые Hunches, с помощью которых Alexa сопоставляет команды и данные от подключенных датчиков или устройств и выдает ответ. Например, при анализе команды «Alexa, спокойной ночи» помощник проверит, включены ли в вашем гараже огни и оставляете ли вы их обычно включенными в это время суток, и сообщает ответ. Алекса может ответить что-то вроде: «Спокойной ночи. Кстати, я заметила, что в вашем гараже горят огни. Хотели бы вы, чтобы я отключила их?» Таким образом клиенты получают полезную обратную связь без необходимости копаться в куче различных приложений.
В этих функциях используются методы машинного обучения, предоставляемые Amazon Web Services. Мы используем эти масштабируемые возможности в реальном времени на платформе SageMaker, что позволяет нам выполнять итерации намного быстрее.
VentureBeat: Кажется, как вы сказали несколько минут назад, что популярность умного дома растет, возможно, отчасти благодаря более дешевым подключенным устройствам, таким как недавно анонсированная Philips технология Hue, совместимая с Bluetooth. Какие еще есть способы снижения порога вхождения для начинающих покупателей?
Смит: Мы очень долго работаем над этим, и одна из вещей, которые нас больше всего радуют, это возможность настройки без касаний. В прошлом году мы объявили о Wi-Fi Simple Setup, которая позволяет быстро настроить такие Wi-Fi-устройства, как Amazon Smart Plug. По сути, вы подключаете его, и Alexa говорит: «Привет, я нашла ваше новое устройство». Никаких других настроек не требуется. Мы привносим такой же опыт в лампочки Bluetooth Low Energy и в такие новые продукты, как Philips Hue, и мы действительно работаем над тем, чтобы расширять использование этой технологии.
Что касается настройки нового устройства, которое общается с Alexa, то мы уже в конце прошлого года реализовали несколько функций, которые помогут вам выполнить ряд настроек с контекстным распознаванием команд, при котором применяется полностью естественное взаимодействие с Alexa. Мы хотим, чтобы клиенты могли, скажем, размещать свои умные устройства в разных комнатах, и при обращении к одному из них Alexa выбирала именно то устройство, которое нужно.
Вот почему в прошлом году мы внедрили более совершенную контекстную настройку. Если вы скажете «Алекса, включи свет», она может через голосовое управление помочь вам настроить освещение в комнате, попутно зажигая там свет. Мы увидели, что клиенты действительно хорошо к этому относятся, потому что это не мешает управлять устройством в первый раз.
VentureBeat: Я уверен, что вы должны учитывать различные форм-факторы устройств с Alexa, верно? Я имею в виду, если мы сравним Echo Dot и Echo Show.
Смит: Мы думаем об этом как о сетке между различными категориями — между приложением, голосом и экраном, — потому что у каждого есть свои сильные стороны. Голос действительно великолепен, когда вы пытаетесь сделать что-то без помощи рук, но не так хорош, когда вам нужно сделать что-то тихо. В таких случаях мы опираемся на экранные взаимодействия.
Что нас действительно радует, так это то, что по мере того, как все более разнообразные клиенты начинают использовать Alexa, мы идем в ногу с их потребностями, не оглядываясь назад, и не спрашиваем себя: «как нам научить этих клиентов уже устаревшим моделям?» Вместо этого мы используем такие технологии, как машинное обучение, чтобы смотреть вперед и подстраиваться под пользователей.
Ключ в том, чтобы использовать технику, подходящую для типа проблемы, будь то изучение поведенческого паттерна или попытка установить семантическое сходство с основополагающими истинами. Затем идет настройка метамодели, которая учитывает эти отдельные сигналы, создавая пользовательский опыт, который будет полезен, а не будет строиться на предположениях.
Источник: Amazon wants smart home device setup to be a ‘zero-touch’ experience
Поделитесь этим с друзьями!
Будьте первым, кто оставит комментарий
Пожалуйста, авторизируйтесь для возможности комментировать