Amazon의 오디오북 내레이터가 이제 자체 AI 음성 클론을 만들 수 있습니다.

avatar
WIRED
09-14
이 기사는 기계로 번역되었습니다
원문 표시

합성 음성은 수년 동안 널리 퍼져왔고, 새로운 20년대의 생성적 AI 붐은 그 과정을 바로 가속화했습니다. AI 음성은 팟캐스트 , 정치 캠페인 , 유명인의 목소리를 미묘하게 모방 하는 챗봇 등 어디에나 있습니다. 곧 오디오북에도 모두 등장할 것입니다.

Amazon 소유의 오디오북 회사인 Audible은 오디오북 시장에서 작품을 읽어주는 AI 음성 클론을 생성하는 시범 프로그램을 발표했습니다 . 이 발표는 저자와 출판사가 쓰여진 책을 오디오북으로 바꿀 수 있는 Audible의 서비스인 ACX(Audiobook Creation Exchange)에 게시된 글을 통해 이루어졌습니다.

게시물에는 "우리는 카탈로그를 확장하는 데 도움이 되는 새로운 기술을 테스트하기 위해 측정된 단계를 밟고 있습니다."라고 적혀 있으며, "이번 주에는 소수의 내레이터를 초대하여 미국 전용 베타에 참여시켜 AI 생성 음성 기술을 사용하여 자신의 음성 복제본을 만들고 수익을 창출할 수 있도록 합니다."라고 적혀 있습니다.

오디블에 따르면, 내레이터와 작가 모두 AI 음성이 어떤 프로젝트에 사용될지 스스로 결정할 수 있으며, 최종 내레이션은 ACX의 제작 과정의 일환으로 검토되어 발음 오류나 기타 오류가 있는지 확인될 예정입니다.

그래도 이는 Audible의 현재 내레이션 오디오북에 대한 접근 방식과 약간 어긋나는 것처럼 보일 수 있습니다. 이 발표 이후에도 ACX의 제출 요구 사항은 여전히 오디오북 내레이션은 "인간이 내레이션해야 함"이라고 명시하고 있기 때문입니다. 하지만 Amazon은 이미 AI에 대해 강경한 입장을 취했으며, 작년에 Kindle 직접 출판 운영을 위해 유사한 AI 오디오 프로그램을 구현했습니다.

지금 당장 Audible 프로그램은 제한적이며, 일부 내레이터만 참여합니다. 하지만 앞으로 어떻게 될지는 쉽게 알 수 있으며, Audible은 곧 모든 저자가 자신의 책을 읽을 수 있는 AI 음성을 생성할 수 있도록 개방될 수 있습니다. 다른 회사들도 이 분야에서 활동하고 있습니다. 스타트업 Rebind는 저자가 자신의 음성을 복제하여 AI 버전이 독자를 텍스트로 "안내"할 수 있도록 허용하도록 모집하고 있습니다. 오디오북 팬들은 이 모든 것에 대해 확신이 서지 않습니다 .

개인적으로, 저는 이 달콤하면서도 섬뜩한 목소리가 공룡 에로티시스트 들의 손에 들어갈 때까지 기다릴 수 없습니다.

이번 주의 다른 소비자 기술 뉴스는 다음과 같습니다.

Google은 사용자가 개인 정보를 더욱 디지털화할 수 있도록 허용하고 있습니다. 다음은 여권입니다.

Google은 작년에 Wallet 플랫폼에 디지털 운전면허증을 추가하여 Android 사용자가 휴대폰에 식별 정보를 저장할 수 있게 했습니다. 곧(Google은 언제인지 정확히 말하지 않음) 사용자는 미국 여권에서도 동일한 작업을 수행 할 수 있게 됩니다.

물론 몇 가지 주의 사항이 있습니다. 여권의 Google Wallet 버전은 디지털 ID가 허용되는 특정 TSA 체크포인트에서만 허용됩니다. ( 지도는 여기 있습니다. ) 또한 Google은 어쨌든 여권을 손에 들고 다닐 것을 권장합니다. 디지털 ID는 일반적으로 공항 외부에서는 허용되지 않으므로 해외에서 궁지에 몰리면 실제 문서를 가지고 있어야 합니다. 하지만 운이 좋은 일부 여행객의 경우 공항 보안을 통과할 때 가방에서 또 다른 것을 꺼내야 하는 문제를 해결할 수 있습니다.

안녕하세요, Google에 대해 말씀드리자면, 이 회사는 또한 우리 더러운 브라우저 탭 수집가들에게 좋은 소식을 발표했습니다. 탭 그룹화는 Google Chrome의 기능으로, 모든 브라우저 탭을 그룹 폴더 아래에 숨겨서 더 쉽게 정렬할 수 있습니다. (나중에 읽어볼게요, 맹세합니다!) Google은 그룹화 기능이 곧 플랫폼 간에 동기화되도록 만들 것이라고 말합니다. 즉, 모바일 기기에서 데스크톱 브라우징 여정을 원활하게 계속할 수 있으며, 모바일 기기에서는 탭을 계속 무시하지 않을 것입니다.

탭 그룹화는 곧 iOS의 Chrome에서도 사용할 수 있으며 데스크톱 간에도 동기화할 수 있어야 합니다. 이 모든 것이 언제쯤 나올까요? 글쎄요, 다시 말하지만 Google은 이에 대해 명확히 밝히지 않았습니다. 그럼에도 불구하고 지금 당장 모든 브라우저 탭을 수집하는 것이 좋습니다. 언제 다시 필요할지 모르니까요.

Meta(페이스북, 인스타그램, 왓츠앱을 운영하는 회사이자 AI를 하는 회사)는 AI 서비스가 새로운 문화 영역인 영국인을 식민지화할 것이라고 발표했습니다. Meta는 영국에서 자사 플랫폼 사용자 의 데이터로 AI 모델을 훈련할 것이라고 발표했습니다.

구체적으로, 영국에서 Facebook이나 Instagram을 사용하는 모든 사람에게서 데이터를 수집한 다음, Meta의 AI를 그에 따라 훈련하는 데 사용합니다. Meta는 발표에서 이러한 움직임이 AI 도구가 영국 문화와 언어를 더 정확하게 반영하는 데 도움이 되기를 바란다고 말합니다.

Meta는 영국 사용자가 변경 사항을 알리는 알림을 받게 되며, 양식을 작성하거나(또는 Facebook과 Instagram에서 나가기만 하면) 데이터 수집을 거부할 수 있다고 말합니다. 이 정책은 영국의 규제 기관과 개인 정보 보호 옹호자들 사이에 경각심을 불러일으킬 것입니다. 두 기관 모두 이미 이 계획에 대한 우려를 표명 했습니다.

이 소식은 9월 25일과 26일에 예정된 회사의 제품 쇼케이스 겸 개발자 모임인 Meta Connect 에 앞서 전해졌습니다. 회사가 그때 무엇을 발표할지는 확실하지 않지만, 아마도 메타버스에서 적어도 몇 가지 영국식 악센트가 더 등장할 것으로 기대할 수 있을 것입니다.

Apple 이벤트는 항상 전체적인 행사 입니다. 사실, 한꺼번에 여러 가지 전체적인 행사가 펼쳐지는 거죠. 이번 주에 Apple은 새로운 iPhone , Apple Watch, 그리고 이제 보청기로도 쓸 수 있는 AirPods에 대한 많은 세부 정보를 발표했습니다. 또한 6월에 WWDC 이벤트에서 발표했지만 아직 출시되지 않은 Apple Intelligence 기능 중 많은 부분을 시청자들에게 선보였습니다. 그럼에도 불구하고 Apple은 생성 AI 기반 도구가 새로운 기기에 대한 수요를 끌어올릴 것으로 매우 기대하고 있습니다.

이번 주 Gadget Lab 에서는 WIRED 리뷰 편집자 Adrienne So와 Julian Chokkattu가 출연하여 Apple 본사에서 보낸 시간과 회사가 선보인 모든 새로운 하드웨어 및 소프트웨어에 대한 이야기를 나눕니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
3
즐겨찾기에 추가
1
코멘트
1