Главная » 2010 » Февраль » 19 » Sensory предложила недорогой чип для речевого интерфейса
17:50
Sensory предложила недорогой чип для речевого интерфейса
Компания Sensory, специализирующаяся на микросхемах для реализации речевого интерфейса, анонсировала новый чип NLP-5X, который способен распознавать и синтезировать речь, воспроизводить MP3 и MIDI-файлы, и стоит при этом всего около 2 долл. Создатели столь впечатляющего устройства полагают, что новым чипом, в первую очередь, заинтересуются ведущие производители электронных игрушек, такие как JVC, Mattel и Hasbro. Впрочем, на этом перечень возможных применений NLP-5X отнюдь не заканчивается, поскольку речевой интерфейс может оказаться востребованным в самой разнообразной электронике.
По словам производителя, при разработке NLP-5X по сравнению с его предшественниками была полностью переработана архитектура всего чипа. В частности, внутренние микроконтроллеры были модернизированы до сигнальных процессоров (DSP) с увеличением производительности, а разрядность цепей цифроаналогового и аналого-цифрового преобразования была увеличена с 12 до 16 бит.
Система распознавания речи, встроенная в NLP-5X, относится к типу, не требующему обучения для привязки к конкретным особенностям произношения того или иного человека (в отличие от обучаемых систем, например, от Dragon Naturally Speaking от Nuance). Но все же, по информации Sensory, возможности распознавания нового чипа остаются достаточно широкими. Тодд Мозер (Todd Mozer), исполнительный директор компании, говоря о возможностях NLP-5X, привел пример с духовкой, организация речевого интерфейса в которой была сложной задачей на элементной базе предыдущего поколения, но может быть достаточно просто реализована с применением представленной микросхемы. В результате, сказал он, духовке можно голосом «объяснить» желаемую температуру нагрева или, скажем, способ приготовления. Ну а сама духовка может при необходимости «уточнить» пожелания владельца – тоже голосом. Наконец, при наличии соединения с Интернетом вполне можно организовать чтение рецептов вслух.
Мозер сообщил, что встроенная система голосового морфинга обеспечивает возможность синтезирования сотен голосов, включая мужские и женские, но уточнил, что записей семплов речи знаменитостей компания не делала. Он сообщил также, что чип содержит 24-голосый MIDI-синтезатор, и даже поддерживает интерфейс на основе жестов, а низкий ток потребления – всего 30 мкА при интенсивной нагрузке – обеспечивает возможность применения NLP-5X в мобильных устройствах. По заверениям Мозера, на сегодняшний день Sensory заметно опережает конкурентов в данном сегменте.