Phong cách viết của ChatGPT, có nguồn gốc từ Kenya.

Bài viết này được dịch máy
Xem bản gốc

Lý do cho phong cách viết kỳ lạ của ChatGPT (thường được biết đến là mang đậm dấu ấn trí tuệ nhân tạo) đã được tìm ra!

Nhà văn người Kenya: Tất cả bọn họ đều học hỏi từ chúng ta.

Mới đây, một bài đăng "tố cáo" của một nhà văn người Kenya đã đứng đầu danh sách bài đăng thịnh hành trên Hacker News —

Tôi là người Kenya. Không phải phong cách viết của tôi giống với ChatGPT, mà ngược lại, phong cách viết của ChatGPT giống với phong cách viết của tôi.

Sau khi nhấp chuột, tôi phát hiện ra rằng một số bài viết được bạn tôi trau chuốt tỉ mỉ đã bị từ chối, tất cả chỉ vì lý do "quá giống với ChatGPT".

Ừm... Xét đến việc anh ta được dạy từ nhỏ rằng "một bài viết phải giống như một công trình hoàn hảo" và "phải thể hiện vốn từ vựng phong phú", và giờ lại bị trí tuệ nhân tạo nhầm lẫn cho rằng người viết, người bạn này không khỏi nổi giận:

Gửi những nhà điều tra đang hăng hái vạch trần gian lận kỹ thuật số, tôi muốn nói: Các bạn thân mến, chào mừng đến với một ngày thứ Ba điển hình trong lớp học, phòng họp hoặc phòng chat nội bộ Teams ở Kenya. Những gì các bạn cho rằng là dấu vân tay máy móc thực chất là bằng chứng hóa thạch về nền giáo dục của chúng ta .

Hơn nữa, từ lâu đã có báo cáo rằng để tiết kiệm chi phí nhân công, nhiều nhà sản xuất mô hình AI sẽ thuê ngoài các nhiệm vụ như RLHF cho người châu Phi, do đó thuật ngữ của nhiều mô hình cũng sẽ mang tính thiên vị đối với châu Phi.

Do đó, chúng ta có lý do để nghi ngờ rằng ChatGPT thực sự đã "đánh cắp" kỹ thuật viết từ Kenya.

Chúng ta cùng xem qua nhanh nhé!

"ChatGPT đang vô tình bắt chước chúng tôi."

Đây là những gì đã xảy ra.

Marcus Olang (sau đây gọi tắt là Marcus), đến từ Kenya, gần đây đã đăng một bài viết phàn nàn rằng kể từ khi nhận được phản hồi đầu tiên vào đầu năm, anh ta đã rơi vào tình thế khó xử khi phải "chứng minh mình không phải là trí tuệ nhân tạo". Phản hồi của khách hàng vào thời điểm đó là:

Bài viết của bạn khá tốt và lập luận chắc chắn, nhưng... bạn có thể viết lại theo cách "gần gũi" hơn được không? Hiện tại, nó có vẻ hơi giống với cách viết của ChatGPT quá.

Hơn nữa, không chỉ riêng anh ấy; nhiều người bạn nhà văn của anh ấy cũng nhận được phản hồi tương tự.

Sau khi cẩn thận so sánh văn phong của mình với ChatGPT, Xiao Ma cuối cùng cũng thở dài nhận ra : "Thật ra, văn phong của chúng ta rất giống với ChatGPT ."

Ở một khía cạnh nào đó, người buộc tội không hoàn toàn sai. Phong cách viết của tôi quả thực có một số điểm tương đồng với kết quả đầu ra của mô hình ngôn ngữ lớn.

Chúng ta đều có xu hướng sử dụng những câu văn mạch lạc, cân đối. Chúng ta đều thích sử dụng các từ nối để đảm bảo sự trôi chảy logic. Thỉnh thoảng, chúng ta đều sử dụng (điều này giờ đây nghe có vẻ như là bằng chứng buộc tội) dấu gạch ngang, dấu chấm phẩy hoặc dấu gạch nối để liên kết các ý tưởng liên quan, làm cho câu văn trang nhã hơn so với một dấu chấm đơn giản.

Tuy nhiên, theo ý kiến ​​của Xiao Ma:

Điều trớ trêu là, sự trớ trêu này có thể đã mang lại nụ cười thấu hiểu cho tổ tiên chúng ta.

Ông ấy khẳng định rằng không phải văn phong của ông ấy giống với ChatGPT, mà chính ChatGPT đã vô tình bắt chước họ — bắt chước thế hệ của họ, và các thế hệ trước đó, những người được "tôi luyện" bởi một hệ thống giáo dục nghiêm khắc ở các nước đang phát triển, đặc biệt là ở những nơi như Kenya.

Từ nhỏ, việc dạy viết của Xiao Ma đã nhấn mạnh đến các tiêu chuẩn, sự lựa chọn từ ngữ cẩn thận và cấu trúc câu (ADN của ai mà lại thay đổi thế nhỉ?).

Từ nhỏ, chúng ta đã được dạy rằng một bài viết phải giống như một công trình kiến ​​trúc hoàn hảo . Phần mở đầu là nền móng, phần thân bài là những bức tường chịu lực, và phần kết luận là mái nhà; nó phải vững chắc, cân đối và không tì vết. Chúng ta phải sử dụng "thứ nhất, thứ hai và cuối cùng" để xây dựng logic, "ngoài ra, tuy nhiên và do đó" để tạo sự chuyển tiếp chính xác, và những "từ ngữ hay" như "xuất sắc" và "kiệt sức" để thể hiện vốn từ vựng của mình.

Kiểu viết này là bước đệm của chúng ta , một kỹ năng sinh tồn mà chúng ta phải nắm vững trong 40 phút của kỳ thi KCPE (Kỳ thi tốt nghiệp tiểu học) quyết định vận mệnh của chúng ta, và là bậc thang để chúng ta leo lên cao hơn. Nó chặt chẽ, rõ ràng và thuyết phục, nhưng chính vì điều đó, ngày nay một số người lại cho rằng nó "thiếu đi sự ấm áp của con người".

Và chính hệ thống này đã được trí tuệ nhân tạo học hỏi.

Trớ trêu thay, các mô hình AI lớn (như ChatGPT) học cách viết từ một lượng lớn sách, bài báo và báo cáo . Những kho văn bản này chứa đầy ngôn ngữ viết lắng đọng điển, trang trọng và được tích lũy lịch sử —chính là phong cách mà chúng ta được đào tạo để bắt chước. Vì vậy, khi AI tạo ra nội dung có vẻ "có thẩm quyền" và "đáng tin cậy", phong cách viết của nó tự nhiên tạo ra hiệu ứng "song sinh" kỳ lạ với nền giáo dục của chính tôi.

Do đó, khi đối diện những lời cáo buộc rằng phong cách viết của mình "giống như trí tuệ nhân tạo", Tiểu Mã đã tức giận phản bác:

Trong nỗ lực thể hiện uy quyền, cỗ máy cuối cùng lại phát ra âm thanh giống như một học sinh tốt nghiệp tiểu học Kenya (KCPE) đạt điểm A môn tiếng Anh trong bài luận. Điều này vô tình tái hiện lại bóng dáng ngôn ngữ của Đế quốc Anh.

Ông cũng đề cập rằng một số công cụ phát hiện AI hiện có có xu hướng đánh dấu nhãn văn bản trôi chảy, logic chặt chẽ và có cấu trúc tốt là do AI tạo ra, điều này lại chính xác là đặc điểm viết của nhiều người nói tiếng Anh không phải là người bản xứ (đặc biệt là những người đã được đào tạo viết bài bài bản), khiến họ dễ bị đánh giá sai hơn.

Tóm lại, Xiao Ma dùng kinh nghiệm cá nhân của mình để chia sẻ với mọi người—

Do những lý do lịch sử, các tác phẩm của một số người không phải là người bản ngữ tiếng Anh ban đầu được dùng làm "sách giáo khoa" cho các mô hình AI hiện có, nhưng giờ đây chúng lại trở thành "nạn nhân" của việc ứng dụng rộng rãi AI .

Quan điểm này cũng nhận được sự ủng hộ rộng rãi từ cư dân mạng:

Trớ trêu thay, dù tràn đầy cảm xúc và rất chân thực, bài đăng của Xiao Ma vẫn bị trang web Pangram đánh giá là hoàn toàn do AI tạo ra.

À... Ngựa Nhỏ vẫn im lặng, nó tức giận đến mức phun máu (doge).

Vì người châu Phi sử dụng RLHF, ChatGPT cũng thích dùng từ "delve".

Vì những lý do tương tự, người ta nhận thấy ChatGPT dường như đặc biệt yêu thích từ "delve" (đào sâu, khám phá).

Một bài báo trên tờ The Guardian chỉ ra rằng Jeremy Nguyen, một chuyên gia về trí tuệ nhân tạo đến từ Đại học Công nghệ Swinburne ở Melbourne, đã phát hiện ra—

Trên các trang web học thuật chuyên nghiệp như PubMed, tần suất xuất hiện của từ "delve" đã tăng từ 10 đến 100 lần trong những năm gần đây .

(PubMed chủ yếu lập chỉ mục hơn 5200 tạp chí y sinh học từ hơn 80 quốc gia, với tổng số hơn 39 triệu bài báo.)

Điều này cho thấy rằng một lượng lớn các nhà nghiên cứu có thể đang sử dụng ChatGPT để hỗ trợ việc viết bài và kết hợp vốn từ vựng ưa thích của họ vào các văn bản học thuật chính thức.

Hiện tượng này cũng thu hút sự chú ý của Elon Musk và người đồng sáng lập Y Combinator, Paul Graham, người sau đã đăng tải:

Có người gửi cho tôi một email với từ "delve", điều này cho thấy văn bản có thể được tạo ra bởi trí tuệ nhân tạo (ngụ ý người gửi đã sử dụng AI để viết đề xuất dự án và muốn đầu tư vào đó, haha).

Ngay sau khi Graham đăng bài, tài khoản chính thức của ChatGPT đã sử dụng cụm từ này trong một trò đùa công khai, thu hút vô số cư dân mạng làm theo.

Tuy nhiên, phân tích dữ liệu sâu hơn cho thấy "delve" không phải là trường hợp cá biệt—

Các từ như “khám phá,” “tấm thảm,” “di chúc,” và “đòn bẩy” cũng xuất hiện với tần suất bất thường trong văn bản do ChatGPT tạo ra.

Tờ Guardian đã tiết lộ chi tiết bí ẩn đằng sau điều này trong bài báo của mình—

Để "thuần hóa" các mô hình ngôn ngữ lớn thành các chatbot an toàn, hữu ích và dễ điều khiển, các công ty thường thuê lượng lớn người thử nghiệm để tương tác với các mô hình và cung cấp phản hồi (chẳng hạn như thích/không thích, hoặc viết câu trả lời lý tưởng).

Mô hình học hỏi từ lượng dữ liệu khổng lồ về sở thích của con người để điều chỉnh hành vi của nó, được gọi là RLHF (Học tăng cường dựa trên phản hồi của con người).

Do yếu tố chi phí nhân công, lượng lớn các công việc cần nhiều nhân lực của RLHF đã được thuê ngoài cho các quốc gia châu Phi nói tiếng Anh như Kenya và Nigeria.

Đối với các quốc gia này, những từ như “delve” là tiếng Anh thương mại hoặc học thuật tự nhiên và tiêu chuẩn trong cuộc sống hàng ngày của họ, và do đó được sử dụng thường xuyên.

Do đó, những từ này xuất hiện thường xuyên một cách tự nhiên trong ChatGPT.

Nhân tiện, bạn còn có mẹo nào khác để nhận biết liệu nội dung có phải do AI tạo ra hay không?

Một số cư dân mạng đã nêu gương cho mọi người:

"Tiếng rên rỉ như sư tử con", "đồng tử co lại như đầu kim"... thì, hầu hết mọi người sẽ không bao giờ nghĩ đến điều đó (chú chó Doge).

Liên kết tham khảo:

[1]https://marcusolang.substack.com/p/im-kenyan-i-dont-write-like-chatgpt

[2]https://news.ycombinator.com/item?id=46273466

[3]https://x.com/JeremyNguyenPhD/status/1780580567215681644

[4]https://x.com/ChatGPTapp/status/1780721920322781447

Bài viết này được đăng tải từ tài khoản WeChat công cộng "Quantum Bit" , tác giả: Yishui, và được xuất bản với sự cho phép của 36Kr.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
72
Thêm vào Yêu thích
12
Bình luận