Người kể chuyện sách nói của Amazon hiện có thể tạo bản sao giọng nói AI của riêng họ

avatar
WIRED
09-14
Bài viết này được dịch máy
Xem bản gốc

Giọng nói tổng hợp đã phát triển mạnh mẽ trong nhiều năm và sự bùng nổ AI tạo ra của những năm 20 mới đã đẩy nhanh quá trình đó. Giọng nói AI ở khắp mọi nơi—trong podcast , trong các chiến dịch chính trị và trong các chatbot, nơi chúng có thể sao chép giọng nói của người nổi tiếng một cách không tinh tế . Sớm thôi, chúng cũng sẽ xuất hiện trong sách nói của bạn .

Audible, công ty sách nói thuộc sở hữu của Amazon, đã công bố chương trình dùng thử để tạo bản sao giọng nói AI để đọc tác phẩm trên thị trường sách nói của mình. Thông báo này được đưa ra thông qua bài đăng trên ACX—Audiobook Creation Exchange—dịch vụ của Audible cho phép tác giả và nhà xuất bản chuyển sách viết thành sách nói.

Bài đăng cho biết: "Chúng tôi đang thực hiện các bước thận trọng để thử nghiệm các công nghệ mới nhằm giúp mở rộng danh mục của mình và tuần này, chúng tôi đang mời một nhóm nhỏ người kể chuyện tham gia phiên bản beta chỉ dành cho Hoa Kỳ, cho phép họ tạo và kiếm tiền từ các bản sao giọng nói của chính họ bằng công nghệ giọng nói do AI tạo ra".

Audible cho biết cả người kể chuyện và tác giả đều có quyền kiểm soát các dự án sử dụng giọng nói AI của họ và lời kể chuyện cuối cùng sẽ được xem xét như một phần trong quy trình sản xuất của ACX để kiểm tra lỗi phát âm hoặc các lỗi khác.

Tuy nhiên, điều này có vẻ hơi không phù hợp với cách tiếp cận hiện tại của Audible đối với sách nói có lời bình, vì ngay cả sau thông báo này, các yêu cầu nộp bài của ACX vẫn nêu rõ rằng sách nói "phải do con người đọc". Nhưng Amazon đã rất lạc quan về AI và đã triển khai một chương trình âm thanh AI tương tự cho hoạt động xuất bản trực tiếp trên Kindle vào năm ngoái.

Hiện tại, chương trình Audible còn hạn chế, với một nhóm người kể chuyện được chọn tham gia. Nhưng dễ dàng thấy được điều này có thể đi đến đâu từ đây, và Audible có thể sớm được mở ra để bất kỳ tác giả nào có khả năng tạo ra giọng nói AI có thể đọc sách của riêng họ. Các công ty khác cũng đang tham gia vào lĩnh vực này; công ty khởi nghiệp Rebind đang kêu gọi các tác giả cho phép sao chép giọng nói của họ để phiên bản AI của họ có thể "hướng dẫn" người đọc qua các văn bản của họ. Những người hâm mộ sách nói đang phân vân về tất cả những điều này.

Riêng tôi, tôi không thể chờ đợi cho đến khi những giọng hát ngọt ngào nhưng kỳ lạ này rơi vào tay những kẻ khiêu dâm khủng long .

Sau đây là một số tin tức công nghệ tiêu dùng khác trong tuần này.

Google đang cho phép người dùng số hóa nhiều thông tin cá nhân hơn nữa. Tiếp theo: hộ chiếu.

Google đã thêm giấy phép lái xe kỹ thuật số vào nền tảng Wallet của mình vào năm ngoái, cho phép người dùng Android lưu trữ thông tin nhận dạng trên điện thoại của họ. Sớm thôi (Google không nói chính xác khi nào) người dùng sẽ có thể làm như vậy với hộ chiếu Hoa Kỳ của họ .

Tất nhiên là có một số cảnh báo. Phiên bản Google Wallet của hộ chiếu của bạn sẽ chỉ được chấp nhận tại các trạm kiểm soát TSA cụ thể nơi cho phép sử dụng ID kỹ thuật số. ( Đây là bản đồ. ) Ngoài ra, Google đảm bảo khuyến nghị bạn nên giữ hộ chiếu của mình trong tầm tay. ID kỹ thuật số thường không được chấp nhận ở bất kỳ nơi nào bên ngoài sân bay, vì vậy nếu bạn gặp khó khăn khi ở nước ngoài, bạn sẽ muốn có giấy tờ vật lý của mình. Nhưng đối với một nhóm du khách may mắn, điều này sẽ giải quyết được vấn đề cần phải lấy thêm một thứ nữa ra khỏi túi khi đi qua an ninh sân bay.

Này nói về Google, công ty cũng đã công bố một số tin tốt cho tất cả những người tích trữ tab trình duyệt bẩn thỉu như chúng ta. Nhóm tab là một tính năng trong Google Chrome cho phép bạn lưu trữ tất cả các tab trình duyệt của mình dưới dạng thư mục nhóm để dễ sắp xếp hơn. (Tôi sẽ đọc chúng sau, tôi thề!) Google cho biết tính năng nhóm của họ sẽ sớm được đồng bộ hóa trên nhiều nền tảng. Điều đó có nghĩa là bạn có thể tiếp tục hành trình duyệt máy tính để bàn của mình một cách liền mạch trên thiết bị di động, nơi bạn chắc chắn sẽ không chỉ tiếp tục bỏ qua chúng.

Nhóm tab cũng sẽ sớm có trên Chrome trong iOS và cũng có thể đồng bộ hóa trên máy tính để bàn. Bao lâu nữa thì tất cả những điều này sẽ đến? Vâng, một lần nữa Google không nói rõ về điều đó. Bất kể thế nào, tốt hơn hết là hãy bắt đầu thu thập tất cả các tab trình duyệt đó ngay bây giờ. Không bao giờ biết khi nào bạn có thể cần chúng một lần nữa.

Meta—công ty Facebook, Instagram và WhatsApp cũng thực hiện AI—đã thông báo rằng các dịch vụ AI của họ sẽ xâm chiếm một thế giới văn hóa mới: người Anh. Meta thông báo rằng họ sẽ đào tạo các mô hình AI của mình từ dữ liệu từ người dùng nền tảng của họ tại Vương quốc Anh .

Cụ thể, dữ liệu sẽ được thu thập từ bất kỳ ai sử dụng Facebook hoặc Instagram tại Vương quốc Anh, sau đó được sử dụng để đào tạo AI của Meta theo đó. Trong thông báo của mình, Meta cho biết họ hy vọng động thái này sẽ giúp các công cụ AI của mình phản ánh chính xác hơn văn hóa và ngôn ngữ của Anh.

Meta cho biết người dùng Vương quốc Anh sẽ nhận được thông báo về thay đổi này và họ có thể chọn không tham gia thu thập dữ liệu bằng cách điền vào biểu mẫu (hoặc chỉ cần thoát khỏi Facebook và Instagram). Chính sách này chắc chắn sẽ gây báo động cho các cơ quan quản lý và những người ủng hộ quyền riêng tư tại Vương quốc Anh; cả hai đều đã bày tỏ lo ngại về kế hoạch này.

Tin tức này được đưa ra trước Meta Connect , buổi giới thiệu sản phẩm và buổi họp mặt các nhà phát triển của công ty dự kiến diễn ra vào ngày 25 và 26 tháng 9. Không chắc chắn công ty sẽ thông báo gì vào lúc đó, nhưng có lẽ chúng ta có thể mong đợi ít nhất một vài giọng Anh nữa trong metaverse.

Sự kiện của Apple luôn là một sự kiện toàn diện. Vâng, thực ra là một loạt sự kiện toàn diện cùng một lúc. Tuần này, Apple đã công bố nhiều chi tiết về iPhone , Apple Watch và AirPods mới của mình, hiện có thể dùng làm máy trợ thính . Sự kiện này cũng đã chiêu đãi người xem nhiều tính năng Apple Intelligence giống như những tính năng mà hãng đã công bố vào tháng 6 tại sự kiện WWDC nhưng vẫn chưa được phát hành. Tuy nhiên, Apple rất hy vọng rằng các công cụ dựa trên AI tạo sinh của mình sẽ thúc đẩy nhu cầu về các thiết bị mới của hãng.

Tuần này trên Gadget Lab , hai biên tập viên đánh giá của WIRED là Adrienne So và Julian Chokkattu sẽ tham gia chương trình để chia sẻ về thời gian ở trụ sở chính của Apple cũng như tất cả các sản phẩm phần cứng và phần mềm mới mà công ty đã giới thiệu.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
3
Thêm vào Yêu thích
1
Bình luận
1