Các mô hình AI có thể dự đoán những gì bạn sẽ mua tốt hơn bạn nghĩ

Bài viết này được dịch máy
Xem bản gốc

Quên các nhóm tập trung đi: Một nghiên cứu mới phát hiện ra rằng các mô hình ngôn ngữ lớn có thể dự đoán liệu bạn có muốn mua thứ gì đó hay không với độ chính xác đáng kinh ngạc, vượt trội hơn hẳn các công cụ tiếp thị truyền thống.

Các nhà nghiên cứu tại Đại học Mannheim và ETH Zürich đã phát hiện ra rằng các mô hình ngôn ngữ lớn có thể sao chép ý định mua hàng của con người - chỉ số "Khả năng bạn mua sản phẩm này là bao nhiêu?" được các nhà tiếp thị ưa chuộng - bằng cách chuyển đổi văn bản dạng tự do thành dữ liệu khảo sát có cấu trúc.

Trong một bài báo được công bố tuần trước, nhóm nghiên cứu đã giới thiệu một phương pháp có tên là " Xếp hạng tương đồng ngữ nghĩa", phương pháp này chuyển đổi các phản hồi mở của mô hình thành xếp hạng " Likert " dạng số, một thang điểm năm điểm được sử dụng trong nghiên cứu người tiêu dùng truyền thống.

Thay vì yêu cầu mô hình chọn một số từ một đến năm, các nhà nghiên cứu đã để mô hình trả lời một cách tự nhiên - "Tôi chắc chắn sẽ mua cái này" hoặc "Có thể nếu nó đang được giảm giá" - và sau đó đo lường mức độ gần về mặt ngữ nghĩa của những câu phát biểu đó với các câu trả lời chính tắc như "Tôi chắc chắn sẽ mua cái này" hoặc "Tôi sẽ không mua cái này".

Mỗi câu trả lời được ánh xạ trong không gian nhúng đến câu tham chiếu gần nhất, về cơ bản biến văn bản LLM thành xếp hạng thống kê. "Chúng tôi chứng minh rằng việc tối ưu hóa độ tương đồng ngữ nghĩa thay vì nhãn số sẽ mang lại phân phối ý định mua hàng khớp chặt chẽ với dữ liệu khảo sát của con người", các tác giả viết. "Các phản hồi do LLM tạo ra đạt được 90% độ tin cậy của các cuộc khảo sát lặp lại của con người, đồng thời vẫn duy trì được sự khác biệt tự nhiên trong thái độ."

Trong các thử nghiệm trên 9.300 phản hồi khảo sát của người thật về các sản phẩm chăm sóc cá nhân, phương pháp SSR đã tạo ra những người trả lời tổng hợp có phân phối Likert gần giống với bản gốc. Nói cách khác: khi được yêu cầu "suy nghĩ như người tiêu dùng", các mô hình đã làm như vậy.

Phát hiện này có thể định hình lại cách các công ty tiến hành thử nghiệm sản phẩm và nghiên cứu thị trường. Khảo sát người tiêu dùng thường tốn kém, chậm chạp và dễ bị ảnh hưởng bởi sai lệch. Những người trả lời tổng hợp - nếu họ hành xử giống người thật - có thể cho phép các công ty sàng lọc hàng ngàn sản phẩm hoặc tin nhắn với chi phí chỉ bằng một phần nhỏ.

Nó cũng xác nhận một tuyên bố sâu sắc hơn: rằng hình học của không gian ngữ nghĩa của LLM không chỉ mã hóa sự hiểu biết ngôn ngữ mà còn cả lý luận thái độ . Bằng cách so sánh các câu trả lời trong không gian nhúng thay vì coi chúng là văn bản theo nghĩa đen, nghiên cứu chứng minh rằng ngữ nghĩa mô hình có thể thay thế cho phán đoán của con người với độ chính xác đáng kinh ngạc.

Đồng thời, nó cũng làm nảy sinh những rủi ro về mặt đạo đức và phương pháp luận quen thuộc. Các nhà nghiên cứu chỉ thử nghiệm một danh mục sản phẩm, bỏ ngỏ khả năng liệu phương pháp tương tự có áp dụng được cho các quyết định tài chính hay các chủ đề mang tính chính trị hay không. Và "người tiêu dùng" tổng hợp có thể dễ dàng trở thành mục tiêu tổng hợp: các kỹ thuật mô hình hóa tương tự có thể giúp tối ưu hóa thuyết phục chính trị, quảng cáo hoặc các tác động thúc đẩy hành vi.

Theo cách nói của các tác giả, “áp lực tối ưu hóa do thị trường thúc đẩy có thể làm xói mòn sự liên kết một cách có hệ thống”—một cụm từ có ý nghĩa vượt xa phạm vi tiếp thị.

Các tác giả thừa nhận rằng phạm vi thử nghiệm của họ - các sản phẩm chăm sóc cá nhân - khá hẹp và có thể không áp dụng được cho các giao dịch mua sắm mang tính rủi ro cao hoặc mang tính cảm xúc. Việc lập bản đồ SSR cũng phụ thuộc vào các tuyên bố tham chiếu được lựa chọn cẩn thận: những thay đổi nhỏ về cách diễn đạt có thể làm sai lệch kết quả. Hơn nữa, nghiên cứu này dựa trên dữ liệu khảo sát con người làm "chân lý cơ bản", mặc dù dữ liệu này thường bị nhiễu và thiên vị về mặt văn hóa.

Các nhà phê bình chỉ ra rằng sự tương đồng dựa trên nhúng giả định rằng các vectơ ngôn ngữ khớp chặt chẽ với thái độ của con người, một giả định có thể sai khi ngữ cảnh hoặc sự mỉa mai xen vào. Các con số độ tin cậy của bài báo - 90% độ nhất quán giữa các lần kiểm tra-tái kiểm tra của con người - nghe có vẻ ấn tượng nhưng vẫn còn chỗ cho sự sai lệch đáng kể. Tóm Short, phương pháp này hoạt động ở mức trung bình , nhưng vẫn chưa rõ liệu những con số trung bình đó có nắm bắt được sự đa dạng thực sự của con người hay chỉ phản ánh các tiên nghiệm đào tạo của mô hình.

Sự quan tâm của giới học thuật đối với "mô hình hóa người tiêu dùng tổng hợp" đã tăng vọt vào năm 2025 khi các công ty thử nghiệm các nhóm tập trung dựa trên AI và thăm dò dự đoán. Các nghiên cứu tương tự của MIT và Đại học Cambridge đã chỉ ra rằng các chương trình Thạc sĩ Luật (LLM) có thể mô phỏng các phân khúc nhân khẩu học và tâm lý học với độ tin cậy trung bình, nhưng chưa có chương trình nào trước đây chứng minh được sự trùng khớp chặt chẽ về mặt thống kê với dữ liệu ý định mua hàng thực tế.

Hiện tại, phương pháp SSR vẫn là nguyên mẫu nghiên cứu, nhưng nó gợi ý về một tương lai mà LLM không chỉ trả lời các câu hỏi mà còn đại diện cho chính công chúng.

Liệu đó có phải là một bước tiến hay chỉ là ảo giác đang hình thành vẫn đang được tranh luận.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận