Перейти к основному контенту
Бизнес ,  
0 

Компания Бекмамбетова начала «клонировать» голоса знаменитостей

Проект Vera Voice занимается развитием нейросети, которая будет способна воспроизводить голоса знаменитостей на русском языке. Ранее Сбербанк заявлял об опасности мошенничества с помощью таких технологий
Тимур Бекмамбетов
Тимур Бекмамбетов (Фото: Евгений Биятов / РИА Новости)

Screenlife Technologies, компания продюсера Тимура Бекмамбетова, и «Стафори» (разработчик HR-сервиса на основе искусственного интеллекта «Робот Вера», в которую инвестирует ФРИИ), создают совместное предприятие для развития проекта Vera Voice. Об этом говорится в поступившем в РБК сообщении компаний.

Проект Vera Voice позволит воспроизводить голоса знаменитостей на русском языке. Он основан на технологии нейросети, которая обучается копировать речь на примере оригинала. Стоимость разработки основатели не назвали.

В России уже реализовывались подобные проекты. В частности, инвестором в подобные технологии является Сбербанк: учрежденная банком в 2013 году компания АБК в январе представила короткий ролик с синтезированным голосом актера Иннокентия Смоктуновского. На нем голос актера произносит: «Прослушав всего около 18 часов записи великого артиста, нейронная сеть теперь способна говорить его голосом».

После этого Сбербанк представил технологию на Российском инвестиционном форуме в Сочи. Зампред правления банка Станислав Кузнецов отметил, что подобные проекты могут использоваться и с незаконными целями. В качестве примера он включил запись, на которой некий вымышленный губернатор голосом Смоктуновского просит 5 млрд руб. на постройку моста.

Открытый алгоритм для синтеза человеческой речи с помощью нейросети под названием WaveNet еще в 2016 году представила принадлежащая Google компания DeepMind. На Западе подобные технологии «клонирования» голоса уже активно применяются: в июле 2019 года инженеры Facebook представили синтезатор речи, который, в частности, сгенерировал голос основателя Microsoft Билла Гейтса. В сентябре Amazon объявил, что голосовая колонка компании — Alexa — сможет разговаривать голосами знаменитостей. Первым стал актер Самуэль Ли Джексон. По оценке консалтинговой компании Markets&Markets, к 2023 году рынок клонирования голоса достигнет $1,73 млрд.

«Как и многие стартапы на русском языке — это клон уже существующей идеи. Есть разделы проблем машинного обучения, связанные с языком, для которых можно делать продукт на локальном рынке по образу и подобию англоязычных. Главное собрать достаточно большую выборку данных на нужном языке. В РФ этим занимаются такие гиганты как Яндекс и Сбербанк. Но для узких задач есть место и мелким игрокам», — заявил РБК российский специалист по data science Павел Плесков.

Индустрия развлечений может быть главным применением для такой технологии, добавил он. «Мошенничество — это самая главная угроза. «Синтезировать голос можно уже по семплу длиной в три секунды. А при текущей популярности робоколов (robocall — автоматический звонок. — РБК) «поделиться» со злоумышленниками таким семплом можно, просто сказав: «Алло! По какому вопросу звоните? С кем я разговариваю?» Дальше мошенники смогут, например, пройти авторизацию в банке по голосу», — пояснил он.

Генерацию голоса из текста старой задачей назвал и специалист компании ESR Labs AG из Германии Дмитрий Шефтелович. «Что касается «клонирования» голоса, то, как и во всех задачах машинного обучения, количество данных играет определяющую роль: для профессионального генерирования речи не так давно требовалось несколько часов записей определенной формы. На данный момент существуют реализации, которым хватает только нескольких секунд необязательно профессионально записанной речи, чтобы «научиться» голосу», — считает специалист.

«Синтез голосов знаменитостей — часть всеобщего интереса к «эмоциональному искусственному интеллекту», когда компании-разработчики пытаются добиться от роботов более естественного звучания, чтобы они не вызывали отторжения у клиентов и пользователей», — заявил РБК гендиректор группы компаний «Центр речевых технологий» Дмитрий Дырмовский. Он отметил, что у данной технологии может быть достаточно широкое применение — от озвучивания книг до маркетинговых компаний с голосами знаменитостей. В то же время синтез голоса может использоваться в ложной рекламе или для фальсификации новостей, отметил Дырмовский.

Кредит наличными от 

БАНК ВТБ (ПАО). ГЕНЕРАЛЬНАЯ ЛИЦЕНЗИЯ БАНКА РОССИИ № 1000. РЕКЛАМА. 0+

Ставки по кредиту ниже

от 30 тыс. до 40 млн ₽

Оставьте заявку онлайн

Оформить прямо сейчас

Авторы
Теги
Прямой эфир
Ошибка воспроизведения видео. Пожалуйста, обновите ваш браузер.

  

Лента новостей
Курс евро на 26 апреля
EUR ЦБ: 98,71 (-0,2)
Инвестиции, 16:51
Курс доллара на 26 апреля
USD ЦБ: 92,13 (-0,37)
Инвестиции, 16:51
Маршрут «Бессмертного полка» в Кишиневе изменят из-за уступки ЕС Политика, 23:10
«Газпром» сообщил о трех рекордах в России за одну зиму Бизнес, 22:55
Мединский заявил о «трех начальниках» у Украины на переговорах с Россией Политика, 22:38
ЦСКА и «Спартак» сыграли безголевую ничью впервые с 2003 года Спорт, 22:29
Стерлигов объявил о разводе с «еретичкой» и отлучении детей от наследства Бизнес, 22:18
Столтенберг заявил, что страны НАТО не передали Киеву обещанную помощь Политика, 22:18
Хуснуллин заявил о хорошем разговоре с Путиным и бизнесом на съезде РСПП Бизнес, 22:06
Тайм-менеджмент: как больше успевать
За 5 дней вы пересмотрите свой подход к планированию и научитесь разным инструментам тайм-менеджмента
Подробнее
Молодежная команда СКА во второй раз стала обладателем Кубка Харламова Спорт, 21:57
Может ли отставка премьера Испании привести к политическому кризису Политика, 21:50
Bloomberg: ЕС запретит реэкспорт СПГ из России, но себе получать разрешит Бизнес, 21:44
Песков заявил, что Путин и бизнес остались довольны съездом РСПП Политика, 21:30
Экспертизы не подтвердили взрыв на Ту-154, в котором летел Качиньский Политика, 21:27
В Батайске из-за конфликта ученика и учительницы приехали мэр и полиция Общество, 21:17
ФИФА и УЕФА выразили обеспокоенность ситуацией в испанском футболе Спорт, 21:15