Tác giả gốc: David, TechFlow
Vào chiều ngày 20 tháng 1, X mã nguồn mở nguồn thuật toán đề xuất mới của mình.
Phản hồi của Musk khá thú vị: "Chúng tôi biết thuật toán này rất ngớ ngẩn và cần được sửa đổi lớn, nhưng ít nhất các bạn có thể thấy chúng tôi đang nỗ lực cải thiện nó trong thời gian thực. Các nền tảng mạng xã hội khác sẽ không dám làm điều này."

Tuyên bố này có hai ý nghĩa. Thứ nhất, nó thừa nhận rằng thuật toán có vấn đề; thứ hai, nó sử dụng "tính minh bạch" như một điểm bán hàng.
Đây là thuật toán mã nguồn mở lần của X. Phiên bản mã năm 2023 đã không được cập nhật trong ba năm và đã lỗi thời so với các hệ thống thực tế. Lần, nó đã được viết lại hoàn toàn, với mô hình cốt lõi được thay đổi từ máy học truyền thống sang bộ chuyển đổi Grok, mà chính thức là "loại bỏ hoàn toàn việc xử lý đặc trưng thủ công".
Nói một cách đơn giản: Trước đây, các thuật toán dựa vào việc các kỹ sư điều chỉnh thủ công các thông số; giờ đây, trí tuệ nhân tạo (AI) trực tiếp xem xét lịch sử tương tác của bạn để quyết định xem có nên hiển thị nội dung của bạn hay không.
Đối với những người sáng tạo nội dung, điều này có nghĩa là những phương pháp bí truyền cũ như "nên đăng bài vào thời điểm nào" và "nên dùng thẻ hashtag nào để thu hút người theo dõi" có thể không còn hiệu quả nữa.
Chúng tôi cũng đã xem qua kho lưu trữ mã mã nguồn mở trên GitHub và, với sự trợ giúp của trí tuệ nhân tạo, đã phát hiện ra rằng thực sự có một số logic phức tạp ẩn trong mã nguồn, đáng để tìm hiểu sâu hơn.
Sự tiến hóa của logic thuật toán: Từ định nghĩa thủ công đến phán đoán tự động bằng trí tuệ nhân tạo
Trước tiên, chúng ta hãy làm rõ sự khác biệt giữa phiên bản cũ và phiên bản mới, nếu không cuộc thảo luận sau này sẽ gây nhầm lẫn.
Vào năm 2023, Twitter mã nguồn mở một phiên bản có tên Heavy Ranker, về cơ bản là máy học truyền thống. Các kỹ sư phải tự tay định nghĩa hàng trăm "đặc điểm": bài đăng có chứa hình ảnh hay không, người đăng bài có bao nhiêu người hâm mộ, bài đăng được đăng cách đây bao lâu, bài đăng có chứa liên kết hay không, v.v.
Tiếp theo, tỷ trọng được gán cho từng đặc điểm, và các tổ hợp được điều chỉnh để xem tổ hợp nào hoạt động tốt nhất.
Phiên bản mã nguồn mở mới lần được gọi là Phoenix, và kiến trúc của nó hoàn toàn khác biệt. Bạn có thể coi nó như một thuật toán dựa nhiều hơn vào các mô hình AI lớn. Cốt lõi của nó sử dụng mô hình transformer của Grok, cùng loại công nghệ được ChatGPT và Claude sử dụng.
Tài liệu README chính thức nêu rõ: "Chúng tôi đã loại bỏ mọi tính năng được thiết kế thủ công."
Tất cả các quy tắc truyền thống dựa vào việc rút thủ công các đặc điểm nội dung đều đã bị loại bỏ.
Vậy, thuật toán này xác định nội dung tốt hay xấu như thế nào?
Câu trả lời nằm ở chuỗi hành vi của bạn. Bạn đã thích gì trong quá khứ, bạn đã trả lời ai, bạn đã xem bài đăng nào lâu hơn hai phút và bạn đã chặn những loại tài khoản nào? Phoenix đưa những hành vi này vào bộ chuyển đổi, cho phép mô hình học các mẫu và tóm tắt chúng.

Để dễ hình dung hơn: thuật toán cũ giống như một bảng chấm điểm viết tay, với mỗi mục được đánh dấu và chấm điểm;
Thuật toán mới giống như một trí tuệ nhân tạo đã xem xét toàn bộ lịch sử duyệt web của bạn, trực tiếp đoán được bạn muốn xem gì tiếp theo.
Đối với người sáng tạo, điều này có nghĩa là hai điều:
Thứ nhất, các kỹ thuật như "thời điểm đăng bài tốt nhất" và "thẻ vàng" hiện nay tham khảo còn phù hợp. Điều này là do mô hình không còn xem xét các đặc điểm cố định này nữa; nó tập trung vào sở thích cá nhân của từng người dùng.
Thứ hai, việc nội dung của bạn có được quảng bá hay không ngày càng phụ thuộc vào "phản ứng của những người xem nội dung của bạn". Phản ứng này đã được định lượng thành 15 dự đoán về hành vi, mà chúng ta sẽ thảo luận chi tiết trong chương tiếp theo.
Thuật toán dự đoán 15 phản ứng của bạn
Sau khi Phoenix nhận được một bài đăng để đề xuất, nó dự đoán 15 hành vi có thể xảy ra mà người dùng có thể thể hiện khi xem nội dung đó:
- Các hành vi tích cực bao gồm : thích, trả lời, chia sẻ, trích dẫn, nhấn bài đăng, nhấn hồ sơ tác giả, xem hơn nửa video, phóng to hình ảnh, chia sẻ, ở lại trang trong một khoảng thời gian nhất định và theo dõi tác giả.
- Các hành vi tiêu cực : chẳng hạn như nhấp vào "không quan tâm", chặn tác giả, tắt thông báo tác giả hoặc báo cáo.
Mỗi hành động tương ứng với một xác suất dự đoán. Ví dụ, mô hình có thể xác định rằng bạn có 60% xác suất thích bài đăng này, 5% xác suất chặn tác giả này, v.v.
Sau đó, thuật toán thực hiện một thao tác đơn giản: nhân các xác suất này với tỷ trọng tương ứng, cộng chúng lại và nhận được tổng điểm.

Công thức trông như thế này:
Điểm số cuối cùng = Σ ( trọng lượng × P(hành động) )
Hành vi tích cực có tỷ trọng dương, và hành vi tiêu cực có tỷ trọng âm.
Các bài đăng có tổng điểm cao hơn sẽ được hiển thị ở đầu, trong khi các bài đăng có điểm thấp hơn sẽ được hiển thị ở cuối.
Nếu không tuân theo công thức thông thường, về cơ bản vấn đề nằm ở chỗ:
Hiện nay, việc nội dung tốt hay xấu không thực sự phụ thuộc vào chất lượng bài viết (mặc dù khả năng đọc hiểu và lòng vị tha là yếu tố cơ bản để lan truyền); mà phụ thuộc nhiều hơn vào "nội dung này sẽ khiến bạn phản ứng như thế nào". Thuật toán không quan tâm đến chất lượng của bài đăng; nó chỉ quan tâm đến hành vi của bạn.
Theo hướng suy nghĩ này, trong những trường hợp cực đoan, một bài đăng tục tĩu nhưng thu hút nhiều phản hồi và chỉ trích có thể đạt điểm cao hơn một bài đăng chất lượng cao nhưng không nhận được tương tác nào. Đây có thể là logic ngầm của hệ thống.
Tuy nhiên, phiên bản mã nguồn mở mới của thuật toán không tiết lộ các giá trị cụ thể của tỷ trọng hành vi, trong khi phiên bản năm 2023 thì có.
Tham khảo từ phiên bản cũ: Một báo cáo = lần lượt thích
Tiếp theo, chúng ta có thể xem xét dữ liệu từ năm 2023. Mặc dù dữ liệu này đã cũ, nhưng nó có thể giúp bạn hiểu được "giá trị" của các hành vi khác nhau thay đổi như thế nào trong mắt thuật toán.
Vào ngày 5 tháng 4 năm 2023, X quả thực đã công khai một bộ dữ liệu tỷ trọng trên GitHub.
Đây là các con số:

Nói một cách đơn giản hơn:

Nguồn dữ liệu: Phiên bản cũ của kho lưu trữ GitHub twitter/the-algorithm-ml , nhấn để xem thuật toán gốc.
Một số con số đáng được xem xét kỹ lưỡng.
Thứ nhất, lượt thích hầu như không có giá trị. Tỷ trọng chỉ là 0,5, thấp nhất trong tất cả các hành động tích cực. Theo thuật toán, một lượt thích có giá trị xấp xỉ bằng không.
Thứ hai, đối thoại tương tác mới là thước đo giá trị thực sự. Tỷ trọng của việc "bạn trả lời và tác giả trả lời lại bạn" là 75, gấp 150 lần so với một lượt thích. Thuật toán ưu tiên đối thoại hai chiều hơn là những lượt thích một chiều.
Thứ ba, phản hồi tiêu cực cực kỳ tốn kém. Một lần chặn hoặc tắt tiếng (-74) cần lần lượt thích để bù lại. Một lần báo cáo (-369) cần lần lượt thích. Hơn nữa, những điểm số tiêu cực này tích lũy vào điểm uy tín của tài khoản, ảnh hưởng đến việc phân phối tất cả các bài đăng tiếp theo.
Thứ tư, tỷ trọng tỷ lệ xem hết video quá thấp, chỉ ở mức 0,005, gần như không đáng kể. Điều này trái ngược hoàn toàn với Douyin và TikTok, vốn coi tỷ lệ xem hết video là một chỉ báo cốt lõi.
Tài liệu chính thức cũng nêu rõ: "Trọng số chính xác trong tệp có thể được điều chỉnh bất cứ lúc nào... Kể từ đó, chúng tôi đã định kỳ điều chỉnh trọng số để tối ưu hóa các chỉ số của nền tảng."
Tỷ trọng có thể được điều chỉnh bất cứ lúc nào, và trên thực tế chúng đã được điều chỉnh.
Phiên bản mới không tiết lộ các giá trị cụ thể, nhưng khung logic được mô tả trong README vẫn giống nhau: điểm dương được cộng, điểm âm bị trừ và phép tính tổng có trọng số được thực hiện.
Mặc dù các con số cụ thể có thể đã thay đổi, nhưng tầm quan trọng của mối quan hệ này có lẽ vẫn còn đó. Trả lời bình luận của ai đó hữu ích hơn là nhận được 100 lượt thích. Khiến ai đó muốn chặn bạn còn tệ hơn là không có tương tác nào cả.
Hiểu được điều này, vậy những người sáng tạo như chúng ta có thể làm gì?
Sau khi phân tích mã thuật toán cũ và mới của Twitter, chúng ta có thể rút ra một vài kết luận hữu ích.
1. Trả lời người bình luận. "Tác giả trả lời người bình luận" nhận được điểm cao nhất (+75) trong bảng tỷ trọng, cao hơn 150 lần so với một lượt thích đơn phương của người dùng. Điều này không có nghĩa là bạn nên cầu xin bình luận, mà là hãy trả lời người đã bình luận. Ngay cả một lời "cảm ơn" đơn giản cũng sẽ được thuật toán ghi nhận.
2. Đừng khiến người khác muốn vuốt bỏ bài đăng. Tác động tiêu cực của một lượt chặn cần tới lần lượt thích để bù đắp. Nội dung gây tranh cãi dễ dàng tạo ra tương tác, nhưng nếu tương tác đó là "Người này thật phiền phức, hãy chặn họ đi", điểm uy tín của tài khoản bạn sẽ tiếp tục bị ảnh hưởng, tác động đến việc phân phối tất cả các bài đăng tiếp theo. Lưu lượng truy cập gây tranh cãi là con dao hai lưỡi; trước khi bạn làm hại người khác, bạn sẽ tự làm hại chính mình trước.
3. Đặt Chuỗi ngoài trong phần bình luận. Thuật toán không muốn đẩy người dùng rời khỏi trang web. Các liên kết trong nội dung chính sẽ bị phạt , như chính Musk đã công khai tuyên bố. Nếu bạn muốn thu hút lưu lượng truy cập, hãy viết nội dung trong phần văn bản chính và đặt liên kết trong bình luận đầu tiên.
4. Tránh spam. Mã mới bao gồm một công cụ chấm điểm sự đa dạng tác giả, giúp hạ thấp thứ hạng của các bài đăng liên tiếp từ cùng một tác giả. Mục đích là để đa dạng hóa nguồn cấp dữ liệu của người dùng, nhưng nhược điểm là một bài đăng được lựa chọn kỹ lưỡng sẽ tốt hơn mười bài đăng liên tiếp như vậy.
6. Không còn "thời điểm đăng bài tốt nhất" nữa. Thuật toán cũ bao gồm yếu tố "thời gian đăng bài" do người dùng định nghĩa, điều mà phiên bản mới đã loại bỏ. Phoenix chỉ xem xét chuỗi hành vi của người dùng, chứ không phải thời gian đăng bài. Các chiến lược như "đăng bài lúc 3 giờ chiều thứ Ba là hiệu quả nhất" ngày càng tham khảo nên kém hữu ích.
Những điều trên là những gì có thể đọc được ở cấp độ mã nguồn.
Ngoài ra, còn có một số điểm thưởng và điểm phạt từ tài liệu công khai của X, không được bao gồm trong kho mã mã nguồn mở lần : Chứng nhận Blue Label mang lại điểm thưởng, viết hoa toàn bộ sẽ bị phạt, và nội dung nhạy cảm sẽ dẫn đến giảm 80% phạm vi tiếp cận. Những quy tắc này không phải là mã nguồn mở , vì vậy tôi sẽ không đi vào chi tiết.
Tóm lại, dự án mã nguồn mở lần khá thiết thực.
Hệ thống bao gồm một kiến trúc hoàn chỉnh, logic truy xuất nội dung ứng viên, quy trình sắp xếp chấm điểm, cùng với việc triển khai các bộ lọc khác nhau. Mã nguồn chủ yếu được viết bằng Rust và Python, với cấu trúc rõ ràng, và tệp README chi tiết hơn nhiều so với các dự án thương mại khác.
Tuy nhiên, một số yếu tố quan trọng vẫn chưa được công bố.
1. Các tham số tỷ trọng không được công khai. Mã nguồn chỉ nêu rõ "hành vi tích cực cộng điểm, hành vi tiêu cực trừ điểm", mà không chỉ rõ số điểm cụ thể cho lượt thích hoặc số điểm bị trừ cho việc chặn. Phiên bản năm 2023 ít nhất cũng đã tiết lộ các con số; lần, chỉ có khung công thức được cung cấp.
2. Tỷ trọng của mô hình không được công khai. Phoenix sử dụng Grok Transformer, nhưng các tham số của mô hình không được hiển thị. Bạn có thể thấy cách mô hình được gọi, nhưng bạn không thể thấy cách nó được tính toán bên trong.
3. Dữ liệu huấn luyện không được công khai. Không rõ dữ liệu nào đã được sử dụng để huấn luyện mô hình, cách lấy mẫu hành vi người dùng như thế nào, hoặc các mẫu tích cực và tiêu cực được xây dựng ra sao.
Ví dụ, mã nguồn mở lần giống như việc nói với bạn "chúng tôi sử dụng phép cộng có trọng số để tính tổng điểm", nhưng không cho bạn biết tỷ trọng là gì; hoặc nói với bạn "chúng tôi sử dụng Transformer để dự đoán xác suất của hành vi", nhưng không cho bạn biết cấu trúc bên trong của Transformer trông như thế nào.
Để so sánh, TikTok và Instagram thậm chí còn chưa tiết lộ những chi tiết này. Nội dung mã nguồn mở lần của X quả thực chứa nhiều thông tin hơn các nền tảng chính thống khác. Tuy nhiên, nó vẫn còn xa mới đạt được mức độ "hoàn toàn minh bạch".
Điều này không có nghĩa là mã nguồn mở không có giá trị. Đối với người sáng tạo và các nhà nghiên cứu, việc nhìn thấy mã nguồn luôn tốt hơn là không nhìn thấy nó.





