Искусственный интеллект воссоздал голос британки Сары Эзекиэль по восьми секундам старой записи с VHS-кассеты. Об этом рассказывает BBC.
25 лет назад болезнь двигательных нейронов лишила Сару способности говорить в возрасте 34 лет. Это случилось через несколько месяцев после рождения второго ребёнка.
Дети Авива и Эрик всё детство слышали маму только через синтезатор речи с роботизированным голосом. У них не было воспоминаний о настоящем голосе матери.

Британская компания Smartbox попросила Сару предоставить час записи для воссоздания голоса. Семья нашла только старую VHS-кассету с записью 1990-х годов. На плёнке едва слышно восемь секунд голоса Сары среди шумов телевизора и искажений.
Качество записи было настолько плохим, что инженер Саймон Пул сначала не верил в успех. Сара потеряла голос в 2000 году, до эпохи смартфонов и соцсетей. В то время семьи редко записывали повседневные моменты на качественные устройства.
Болезнь двигательных нейронов поражает около 1000 человек в год в Великобритании. Большинство пациентов теряют способность говорить из-за мышечной слабости.
Инженер использовал технологию компании ElevenLabs для изоляции голоса от фонового шума. Затем ИИ восстановил интонации и особенности речи на основе тысяч других голосов.
«После такого долгого времени я не могла вспомнить свой голос. Когда я впервые услышала его снова, мне хотелось плакать».
Новый голос изменил отношения в семье — теперь Сара может выражать эмоции. Раньше она могла говорить только монотонным синтезированным голосом, как физик Стивен Хокинг.

Эксперты отмечают важность сохранения индивидуальности голоса для самоидентификации. ИИ-голоса значительно превосходят старые компьютеризированные системы речи.
Читать первым в Telegram-канале «Код Дурова»