Techbus.Ru

Apple рассказала, как Siri учится новым языкам

Фото

          6 лет назад Apple начала популяризировать голосового ассистента Siri, и в 2017 году владельцы смартфонов, планшетов, телевизионных приставок и ноутбуков Apple могут общаться на двух десятках языков, включая русский. Для сравнения, Google Assistant понимает лишь пять языков, а Alexa в Amazon Echo только два: английский и немецкий. В iOS 10.3 появилась поддержка шанхайского языка, который, как и ряд других азиатских диалектов, считается крайне сложным для изучения даже опытными лингвистами. В интервью Reuters Алекс Асеро, который курирует обучение Siri новым языкам, рассказал, из каких этапов состоит процесс приобщения программного ассистента к новому языку.

Асеро присоединился к команде разработчиков в 2013 году и в настоящее время возглавляет команду, обучающую Siri новым языкам. Главной проблемой является прежде всего распознавание речи, и первое время это происходило с помощью алгоритма от Nuance, но в дальнейшем Apple перешла на собственную разработку, которая основана на машинном обучении и с каждым новым запросом улучшает понимание речи людей. На первом этапе обучения Apple набирает группу носителей языка, которые зачитывают отрывки текста и длинные списки слов с разным акцентом. Человеческая речь записывается и транскрибируется другими людьми. Это формирует каноническое представление о том, как звучат слова. Именно эти данные вводятся в алгоритмическую модель машинной подготовки. Система пытается предсказать транскрипцию произвольных строк слов для лучшего распознавания будущего текста, Apple вносит корректировки, и со временем работа алгоритмов улучшается.

Однако прежде чем открыть язык для Siri, Apple делает его доступным в функции "Диктовка" на iOS и macOS, а также в клавиатуре для iPhone. Компания собирает анонимные данные с часто встречающимися речевыми оборотами, а также учит систему распознавать слова на фоне шума, помех, кашля, чтобы улучшить процесс распознавания слов в сложных условиях. По данным Асеро, такая своеобразная репетиция позволяет снизить количество ошибок практически вдвое. Доступ Siri к новому языку открывают лишь тогда, когда Apple решает, что ассистент набрался опыта для самостоятельной работы. Перед запуском специально отобранные люди записывают несколько фраз-заготовок, а также ответы на самые часто задаваемые вопросы, включая "Siri, расскажи анекдот". Ответы на вопросы в духе "Найди ресторан поблизости" формируются динамически в зависимости от ряда условий. Каждые две недели Apple обновляет базу вопросов с готовыми ответами. К сожалению, на сегодняшний день ни Siri, ни другие помощники не умеют формулировать ответы абсолютно автономно и нуждаются в доступе к облачным базам данных.

 


Автор
Вьюгин Арсений Викторович