Искусственный интеллект, использующий технологии синтеза речи, теперь способен вести поразительно реалистичные разговоры, имитируя акценты, шепота и даже клонируя голоса других людей. Эти достижения не только открывают новые горизонты в области коммуникации, но также поднимают важные вопросы о безопасности, этике и ответственности.
На сегодняшний день завести разговор с ИИ стало не только проще, но и более естественно благодаря достижениям в области обработки естественного языка и синтеза речи.
Теперь даже возможно использовать инструменты клонирования голоса на базе ИИ для воспроизведения голосов реальных людей. Один из таких инструментов недавно использовался для копирования голоса покойного британского телеведущего сэра Майкла Паркинсона, чтобы создать восьмисерийный подкаст.
Тем не менее, не все сгенерированные ИИ голоса используются в злонамеренных целях. Функция голоса ChatGPT, например, теперь может отвечать с вариациями интонации и акцента на определенные слова так же, как это делает человек, чтобы передать эмпатию и эмоции. Она также может уловить невербальные сигналы, такие как вздохи и всхлипывания, говорить на 50 языках и воспроизводить акценты на лету.
Эти возможности поднимают интересный вопрос: есть ли что-то уникальное в человеческом голосе, что поможет нам отличить его от "робота"?
Профессор фонетики и цифровой обработки речи в Мюнхенском университете Джонатан Харрингтон на протяжении десятилетий изучает тонкости того, как люди говорят, производят звуки слов и акценты.
Он также отметил, что все еще есть несколько важных признаков, которые могут помочь нам определить, разговариваем ли мы с человеком или с искусственным интеллектом.
Директор по информационной безопасности компании Check Point Software Питер Николетти подчеркнул, что важно обращать внимание на неестественные речевые паттерны, включая нерегулярные паузы и необычные фразы. Он также отметил, что искажения звуков и несоответствующий фоновый шум могут указывать на клонирование голоса.
Один из топ-менеджеров в HackerOne Дейн Шерретс смог правильно определить человеческий голос благодаря естественной интонации и дыханию в записях. Он считает, что акцентуация слов в предложении может быть полезным приемом для распознавания компьютерной речи.
В условиях растущих угроз от технологий ИИ важно быть внимательными и осторожными в общении, чтобы защитить себя и свои данные от мошенничества и манипуляций.
По материалам: BBC