Чип мог сделать голосовой контроль повсеместным в электронике: малая мощность чип специального назначения могла сделать распознавание речи повсеместным в электронике.

В ожидании века управляемой голосом электроники исследователи MIT выстроили чип малой мощности, специальный для автоматического распознавания речи. Принимая к сведенью, что мобильный телефон, бегущее ПО распознавания речи имело возможность бы “настойчиво попросить” примерно 1 ватта мощности, новый чип, требует между 0,2 и 10 милливаттами, в зависимости от количества слов, каковые это должно признать.В настоящем применении, которое, возможно, переводит к власти накопления 90 – 99 процентов, каковые имели возможность сделать голосовой контроль практичным для довольно несложных электронных устройств.

Это включает ограниченные властью устройства, каковые должны взять энергию от их среды либо пойти месяцы между обвинениями в батарее. Такие устройства формируют технологическую базу того, что назвало «Интернет вещей» либо IoT, что обращается к идее, что у транспортных средств, устройств, структур гражданского строительства, производственного оборудования, а также домашнего скота не так долго осталось ждать будут датчики, каковые информируют данные конкретно сетевым серверам, помогающим с координацией и обслуживанием задач.

«Речевой вход станет естественным интерфейсом для многих пригодных заявлений и интеллектуальными устройствами», говорит Анэнта Чандрэкэсан, доктор наук Вэнневэра Информатики и Буша Электротехники в MIT, несколько которого создала новый чип. «Миниатюризация этих устройств потребует разного интерфейса, чем прикосновение либо клавиатуры. Будет крайне важно включить речевую функциональность в местном масштабе, дабы спасти системное потребление энергии если сравнивать с исполнением данной операции в облаке».

«Я не пологаю, что мы вправду создали эту разработку для конкретного применения», додаёт Майкл Прайс, что привел дизайн чипа как аспирант MIT в информатике и электротехнике и сейчас трудится на производителя чипов Analog Devices. «Мы постарались положить на место инфраструктуру, дабы дать лучшие компромиссы системному проектировщику, чем они имели бы с прошлой разработкой, было ли это программным обеспечением либо ускорением аппаратных средств».Прайс, Чандрэкэсан, и Джим Гласс, научный сотрудник из Искусственного интеллекта и Лаборатории Информатики MIT, обрисовали новый чип в газете Прайс, представленный несколько дней назад на Интернациональной Твердотельной Конференции по Схемам.

Следы спящегоСегодня, оптимальнее выступающие речевые устройства распознавания, как много других современных систем ИИ, на базе нейронных сетей, виртуальных сетей несложных информационных процессоров, приблизительно смоделированных на людской мозге. Большинство схемы нового чипа касается осуществления сетей распознавания речи максимально действенно.Но кроме того самая действенная властью совокупность распознавания речи скоро истощила бы батарею устройства, если бы она бежала без прерывания.

Так, чип кроме этого включает более несложную «голосовую схему» обнаружения деятельности, которая осуществляет контроль окружающий шум, дабы выяснить, имело возможность ли бы это быть речью. В случае если ответ да, чип разжигает громадную, более сложную схему распознавания речи.В действительности, в экспериментальных целях, у чипа исследователей было три разных голосовых цепи детектирования деятельности, с разными степенями сложности и, следовательно, разное потребление энергии. То, какая схема – большинство действенной власти, зависит от контекста, но в тестах, моделирующих широкий спектр условий, самую сложную из этих трех схем, ведомых к самым громадным сбережениям власти для совокупности в целом.

Кроме того при том, что это потребило практически втрое больше энергии, чем самая несложная схема, это произвело значительно меньше фальшивых хороших сторон; более простые схемы, каковые довольно часто жуют при помощи их энергосбережений, поддельно активируя другую часть чипа.Обычная нейронная сеть складывается из тысяч обработки «узлов», способных к лишь несложным вычислениям, но хорошо связанных между собой.

В типе сети, в большинстве случаев применяемой для голосовой идентификации, узлы устроены в слои. Голосовые эти поданы в нижний слой сети, узлы которой обрабатывают и передают их к узлам следующего слоя, узлы которого обрабатывают и передают их к следующему слою и без того потом. Продукция верхнего слоя говорит о вероятности, что голосовые эти воображают конкретный речевой звук.Сеть голосовой идентификации через чур громадная, дабы вписаться во встроенную память чипа, которая есть проблемой, по причине того, что перемещение вне чипа для данных есть намного громадным числом энергии, интенсивной, чем восстановление ее из местных магазинов.

Так, дизайн исследователей MIT концентрируется на уменьшении количества данных, что чип обязан вернуть от памяти вне чипа.Управление пропускной способностьюУзел среди нейронной сети имел возможность бы получить информацию из дюжины вторых узлов и передать эти к второй дюжине. У каждой из тех двух дюжин связей имеется связанный «вес», число, которое показывает, как заметно эти, отправленные через нее, должны включить в вычисления узла получения.

Первый ход в уменьшении пропускной свойстве памяти нового чипа обязан сжать веса, которые связаны с каждым узлом. Эти развернуты лишь по окончании того, как они будут принесены на чипе.Чип кроме этого эксплуатирует то, что с распознаванием речи волна на волну разрешённых должна пройти через сеть. Поступающий звуковой сигнал разделен на приращения с 10 миллисекундами, каждое из которых должно быть оценено раздельно.

Чип исследователей MIT вводит единственный узел нейронной сети за один раз, но это передает эти от 32 последовательных приращений с 10 миллисекундами до него.В случае если у узла имеется дюжина продукции, то 32 результата проходов в 384 сокровищах продукции, каковые чип хранит в местном масштабе. Любой из тех должен быть вместе с 11 вторыми сокровищами, в то время, когда питается следующий слой узлов и без того потом.

Так, чип заканчивает тем, что потребовал большой схемы встроенной памяти для собственных промежуточных вычислений. Но это приносит лишь один сжатый узел от памяти вне чипа за один раз, поддерживая ее требования к питанию на низком уровне.

Изучение финансировалось через Проект Qmulus, совместное предприятие между MIT и Квантовым Компьютером, и чип был prototyped через тайваньскую Полупроводниковую Университетскую Программу Шаттла Компании-производителя.

5 комментариев к “Чип мог сделать голосовой контроль повсеместным в электронике: малая мощность чип специального назначения могла сделать распознавание речи повсеместным в электронике.”

Оставьте комментарий