Khi lưu lượng truy cập của AI vượt qua lưu lượng truy cập của con người, làm thế nào bạn có thể chứng minh mình là người thật?

Bài viết này được dịch máy
Xem bản gốc

Tác giả: Vaidik Mandloi

Biên soạn bởi: Luffy, Foresight News

Kể từ khi ra mắt ra mắt năm 2022, ChatGPT đã tạo ra một hệ sinh thái khổng lồ gồm các tác nhân AI. Hiện tại, tổng lưu lượng mạng do các chương trình này tạo ra vượt quá tổng lưu lượng của tất cả người dùng trên toàn thế giới. Hành vi trực tuyến của AI khác biệt đáng kể so với con người: chúng không xem quảng cáo, nhấn liên kết hoặc mua sắm trực tuyến; chúng chỉ đơn giản là thu thập dữ liệu mạng để hoàn thành nhiệm vụ và nhiệm vụ rời đi.

Kiến trúc ban đầu và logic kinh doanh của internet được xây dựng dựa trên hành vi và thói quen sử dụng của con người. Tuy nhiên, phần lớn hoạt động trực tuyến ngày nay không bắt nguồn từ người thật, gây ra những vấn đề nghiêm trọng cho các trang web lớn. Hiện tại, 2,5 triệu trang web đã bắt đầu chặn các trình thu thập dữ liệu web bằng AI, và các nền tảng như Perplexity đã vướng vào các vụ kiện liên quan. Nhà cung cấp dịch vụ đám mây Cloudflare thậm chí đã xây dựng một "mê cung bẫy mật", sử dụng văn bản lộn xộn và vô nghĩa do AI tạo ra để tạo ra các trang lặp vô hạn, từ đó bẫy các trình thu thập dữ liệu khác nhau.

Tuy nhiên, một số tác nhân AI tiên tiến đã sở hữu khả năng vượt qua các biện pháp bảo vệ này. Đối diện sự leo thang của cuộc đối đầu giữa con người và máy móc, toàn bộ ngành công nghiệp đã bắt đầu tập trung vào việc phát triển một cơ chế xác minh danh tính con người đáng tin cậy hơn. Hệ thống này cần phải xác định chính xác liệu người vận hành ở đầu bên kia màn hình có phải là con người hay không: khi một người thật vận hành, họ sẽ do dự, mắc lỗi đánh máy và chuyển động con trỏ sẽ thể hiện những rung động nhỏ đặc trưng của hệ thần kinh con người. Bài viết này sẽ phân tích các nguyên nhân đằng sau cuộc cách mạng này, hai giải pháp công nghệ chính thống và những lựa chọn mà mọi người sẽ phải đối mặt: liệu có chấp nhận giám sát sinh trắc học tập trung hay sử dụng công nghệ Bằng chứng không tri thức crypto để đạt được xác minh con người nặc danh.

Trí tuệ nhân tạo Sự lật đổ mô hình kinh doanh trên internet.

Các trang web ngày càng chặn các chương trình AI vì AI đang đồng thời làm suy yếu nền tảng khả năng thương mại của internet từ cả hai phía. Logic lợi nhuận của internet truyền thống được xây dựng dựa trên sự chú ý của người dùng: các nhà xuất bản nội dung kiếm được lợi nhuận khi người dùng truy cập các trang hoặc xem quảng cáo. Nếu AI xử lý việc mua sắm trực tuyến, nó có thể tìm kiếm năm nghìn trang web cùng một lúc, trong khi người bình thường thường chỉ duyệt qua bốn hoặc năm trang.

Tốc độ đọc của AI vượt xa tốc độ của con người; nó có thể so sánh giá cả trên toàn bộ internet và thậm chí đặt lệnh trực tiếp chỉ trong vài phút, tất cả mà không cần hiển thị bất kỳ quảng cáo nào. Điều này có nghĩa là các trang web không phải trả chi phí vận hành máy chủ mà không thu được bất kỳ lợi nhuận.

Trong khi đó, tìm kiếm bằng AI cũng liên tục chuyển hướng lưu lượng truy cập trang web. Sau khi Google thêm phần tóm tắt thông minh được hỗ trợ bởi AI vào đầu kết quả tìm kiếm, chỉ có 8% người dùng nhấn vào trang web gốc, dẫn đến lượng truy cập vào các trang web nội dung lớn từ Google giảm 33%. Chỉ trong vòng một năm ra mắt , tính năng này đã vượt qua 1 tỷ người dùng hoạt động hàng tháng và khối lượng tìm kiếm trên nền tảng đã tăng trưởng mỗi quý kể từ khi ra mắt .

Nhiều người có lẽ vẫn còn nhớ đến Chegg, nền tảng hỏi đáp trực tuyến. Ban đầu dựa vào lợi thế xếp hạng tìm kiếm để tập trung vào hỏi việc kinh doanh học thuật, giờ đây nó đã chính thức đóng vỡ nợ phần hỏi đáp của mình, đổ lỗi cho sự sụp đổ này là do tác động của ChatGPT. Người hành nghề nội dung đang rơi vào thế khó xử: một mặt, các trình thu thập dữ liệu web đang tràn lan sao chép nội dung từ các trang web, mặt khác, các bản tóm tắt bằng AI đang chặn lưu lượng truy cập trước khi người dùng thậm chí tiếp cận trang web.

Dữ liệu thậm chí còn đáng báo động hơn. Với mỗi lưu lượng truy cập được chuyển hướng mà trình thu thập dữ liệu của OpenAI mang đến cho một trang web đối tác, nó trước tiên phải thu thập dữ liệu từ 400 trang; đối với Anthropic, tỷ lệ này lên tới 38.000:1. Các công ty này sử dụng dữ liệu công khai từ khắp internet để đào tạo các mô hình AI miễn phí, và sau đó chuyển hướng lưu lượng truy cập ban đầu thuộc về các trang web đó bằng các sản phẩm hoàn chỉnh của họ.

Trong các ngành công nghiệp khác, những hành vi thu thập dữ liệu mang tính trục lợi như vậy đã dẫn đến vô số vụ kiện tụng, nhưng trong lĩnh vực trí tuệ nhân tạo, các công ty này có thể đạt được mức định giá hàng nghìn tỷ đô la.

Cơ thể bạn chính là mã số mới.

Trong 25 năm qua, internet chủ yếu dựa vào CAPTCHA để phân biệt giữa người và máy. Người dùng cần nhận diện biển báo giao thông và nhập các ký tự bị biến dạng. Cơ chế này hiệu quả vì, trong giai đoạn đầu, khả năng nhận diện hình ảnh của máy móc kém hơn nhiều so với con người.

Tình hình hiện nay đã hoàn toàn đảo ngược. Hệ điều hành dựa trên trí tuệ nhân tạo của OpenAI đạt điểm cao hơn nhiều so với con người trong hệ thống xác minh người dùng của Google, có khả năng nhấn giao diện và sao chép, dán nội dung; ảnh do AI tạo ra có thể đánh lừa các hệ thống xác minh danh tính, và thậm chí tội phạm ngụy tạo sử dụng các cuộc gọi video độ sâu để thực hiện chuyển khoản ngân hàng. Tiền đề của các phương pháp xác minh truyền thống—rằng máy móc kém khả năng hơn con người—không còn tồn tại nữa.

Ngành công nghiệp chỉ có thể tập trung vào những lĩnh vực mà trí tuệ nhân tạo (AI) chưa thể sao chép được. Một trong những lĩnh vực đó là đặc điểm hành vi của con người khi sử dụng thiết bị điện tử, còn được gọi là sinh trắc học hành vi. Các công ty như IBM và BioCatch đang phát triển các hệ thống liên quan. Công nghệ này không chỉ xác minh danh tính trong quá trình đăng nhập mà còn giám sát hoạt động của người dùng trong suốt quá trình, thu thập dữ liệu về tốc độ di chuyển con trỏ, cuộn trang, nhịp điệu gõ phím, lực nhấn phím, thói quen xóa và chỉnh sửa văn bản, và góc cầm điện thoại. Con quay hồi chuyển của điện thoại ghi lại tất cả thông tin liên quan.

Hệ thống cũng có thể nhận biết các chi tiết như tay thuận và kiểu vuốt ngón tay của người dùng. IBM chỉ cần thu thập dữ liệu lần phiên sử dụng để tạo hồ sơ người dùng cá nhân hóa, và sau đó sẽ so sánh từng thao tác với dữ liệu cơ bản trong thời gian thực.

Công nghệ của BioCatch thậm chí có thể nhận diện các vụ lừa đảo trực tuyến. Khi nạn nhân đọc mật khẩu tài khoản theo chỉ dẫn của kẻ lừa đảo qua điện thoại, hệ thống sẽ ghi lại chính xác nhịp gõ phím vội vã và rời rạc của họ. Chỉ trong một năm, hệ thống đã giúp 257 ngân hàng xác định khoảng 2 triệu tài khoản rửa tiền. Giờ đây, EU cũng đang thử nghiệm công nghệ nhận dạng dáng đi. Chỉ sau ba năm kể từ khi kỷ nguyên của các tác nhân AI bắt đầu, các quan chức biên giới EU đã bắt đầu thu thập dữ liệu về tư thế đi bộ của người dân.

Nghiên cứu liên quan cũng kết hợp hiệu ứng Stroop: khi từ "xanh dương" được viết bằng màu xanh lá cây, não bộ con người trải nghiệm sự xung đột giữa ý nghĩa của từ và màu sắc thị giác, dẫn đến thời gian phản ứng chậm hơn đáng kể, nhưng trí tuệ nhân tạo (AI) vẫn không bị ảnh hưởng. Nghiên cứu cho thấy sự can thiệp nhận thức này được phản ánh trực tiếp trong hành vi gõ phím. Nền tảng thậm chí không cần các bài kiểm tra cụ thể; nó có thể xác định người vận hành là con người hay không chỉ đơn giản bằng nhịp điệu gõ phím. Thói quen gõ phím tiết lộ những đặc điểm độc đáo của con người trong quá trình xử lý thông tin của não bộ.

Các công cụ theo dõi web truyền thống chủ yếu ghi lại hành vi duyệt web, nhấn và chi tiêu của người dùng, điều mà người dùng có thể tránh bằng cách chặn cookie, sử dụng VPN và tắt dịch vụ định vị. Tuy nhiên, sinh trắc học hành vi thu thập các đặc điểm bản năng của con người: chuyển động con trỏ và nhịp điệu gõ phím rất khó thay đổi một cách nhân tạo.

Đặc điểm hành vi của mỗi người đều độc nhất vô nhị như dấu vân tay. Không giống như mật khẩu và chìa khóa, hồ sơ sinh trắc học này không thể thay đổi hoặc thiết lập lại. Khi công nghệ này trở nên phổ biến, các nền tảng lớn sẽ buộc phải thích nghi. Công nghệ mô phỏng giọng nói hiện đã có thể tạo ra các cuộc hội thoại giả mạo rất thuyết phục, và công nghệ ngụy tạo độ sâu đang theo sát phía sau. Nếu đây là tương lai, câu hỏi quan trọng nhất đặt ra là: ai sẽ là người cuối cùng kiểm soát dữ liệu con người này?

Ai sẽ kiểm soát hệ thống xác minh danh tính người thật?

Hiện nay, ngành công nghiệp này đã chia thành hai phe, mỗi phe đều đang nghiên cứu các giải pháp xác minh danh tính người thật.

Đầu tiên là World của Sam Altman (trước đây là Worldcoin). Người dùng cần đi trước máy quét mống mắt hình cầu, máy sẽ thu thập thông tin mống mắt và tạo ra chứng chỉ crypto để chứng minh người dùng là một cá nhân duy nhất. Hiện tại, 18 triệu người ở 160 quốc gia trên thế giới đã hoàn tất đăng ký mống mắt. Vào tháng 4 năm 2026, World đã liên tiếp thiết lập quan hệ đối tác xác minh người dùng với ứng dụng hẹn hò Tinder, nền tảng hội nghị video Zoom và nhà cung cấp dịch vụ chữ ký điện tử DocuSign; đồng thời ra mắt công cụ AgentKit cùng với Coinbase, cho phép người dùng liên kết các trợ lý AI của họ với danh tính thật. Nền tảng này có thể xác nhận rằng có một người thật đứng sau trợ lý mà không làm lộ thông tin cá nhân của người dùng.

Tuy nhiên, công nghệ quét mống mắt bị cấm rõ ràng ở nhiều quốc gia. Công chúng không nhận thức được những rủi ro tiềm ẩn liên quan đến việc cho phép thu thập dữ liệu sinh trắc học, đây là lý do cốt lõi dẫn đến sự phản đối từ nhiều quốc gia. Một cuộc điều tra của MIT Technology Review cũng phát hiện ra rằng World, mà không có sự cho phép thích hợp, không chỉ thu thập dữ liệu mống mắt mà còn thu thập bất hợp pháp dữ liệu các dấu hiệu sinh tồn khác như nhịp tim và nhịp thở.

Loại thứ hai là Bằng chứng không tri thức dựa trên công nghệ crypto , cho phép bạn chứng minh mình là người mà không cần tiết lộ danh tính, vị trí hoặc ngoại hình thật. Vitalik Buterin đã đề xuất khái niệm này từ năm 2023. Ông cho rằng rằng nếu không thể xây dựng một hệ thống phi tập trung để xác thực danh tính người thật, internet cuối cùng sẽ chuyển sang kiểm soát danh tính tập trung. Một khi quyền xác minh danh tính bị kiểm soát bởi các tập đoàn hoặc chính phủ, các cơ chế giám sát sẽ ăn sâu vào mạng lưới cơ bản.

Các hệ thống xác thực danh tính cá nhân phi tập trung đã từng có những nỗ lực triển khai quy mô lớn trước đây, nhưng cuối cùng đều thất bại. Idena, một trong dự án chuỗi công khai đầu tiên nhấn mạnh "một người, một danh tính", đã chứng kiến ​​40% tài khoản và 48% phần thưởng bị kiểm soát bởi 23 tổ chức chỉ trong vòng hai năm ra mắt. Đội ngũ vận hành tài khoản ở Ấn Độ, Nga và các địa điểm khác đã thuê người dân bình thường cho mượn danh tính của họ với mức lương dưới một đô la một giờ, thu về lợi nhuận gấp 55 lần lợi nhuận ban đầu. Các nhà nghiên cứu cũng phát hiện ra rằng ngay cả thông tin nhận dạng của trẻ em cũng được sử dụng làm tài khoản bot.

Vitalik đã lường trước rủi ro này. Ông khẳng định rằng phương pháp tấn công rẻ nhất chống lại hệ thống xác minh danh tính người thật ngụy tạo là độ sâu hay các kỹ thuật hacker tinh vi, mà là thuê người thu nhập để cho mượn danh tính của họ. Bất kỳ hệ thống xác minh danh tính người thật nào cũng cần hỗ trợ tài chính: thiết bị quét mống mắt và nút xác minh Chuỗi đều cần đầu tư liên tục.

Tuy nhiên, một khi giấy tờ tùy thân có giá trị kinh tế, thị trường chợ đen cho thuê giấy tờ tùy thân sẽ xuất hiện. Trong một thế giới thực với khoảng cách giàu nghèo rất lớn, những người có vốn mạnh sẽ luôn kiểm soát loại thị trường này.

"Việc áp dụng một cách cưỡng chế nguyên tắc 'mỗi người một phiếu' trong một hệ thống có khích lệ kinh tế thực sự sẽ chỉ lặp lại những sai lầm của các thử nghiệm xã hội tương tự trong thế kỷ 20."

objectively mà nói, cả hai hướng phát triển đều có những nhược điểm rõ ràng. Các giải pháp tập trung có thể đạt được triển khai quy mô lớn, nhưng dữ liệu sinh trắc học của người dùng sẽ được giao phó cho các công ty thu thập thông tin quá mức, và chính các công ty này có thể thu lợi từ sự gia tăng của các bot. Crypto, mặc dù về mặt lý thuyết bảo vệ quyền riêng tư, lại khó khắc phục được sự mất cân bằng kinh tế trong thế giới thực, cuối cùng trở thành kẽ hở cho các ngành công nghiệp chợ đen.

Nếu phải đặt cược, tôi vẫn sẽ đặt cược vào crypto. Bởi vì sinh trắc học hành vi và quét mống mắt tập trung ghi lại vĩnh viễn thông tin thể chất của bạn, và quyền sở hữu thông tin đó thuộc về những người triển khai hệ thống. Một khi họ đã có dữ liệu của bạn, bạn không thể xóa hoặc chuyển nó; dữ liệu sẽ bị khóa trong tay công ty đã thu thập nó.

Ngay cả khi biết Bằng chứng không tri thức có thể bị lợi dụng, chúng vẫn đáng được phát triển vì có thể xác minh danh tính của bạn mà không tiết lộ bất kỳ thông tin bổ sung nào. Ngược lại, nếu phương pháp này bị bỏ rơi, trong tương lai, bất kỳ trang web nào chúng ta truy cập cũng sẽ lưu giữ dữ liệu hành vi của chúng ta. Hiện nay, giải pháp tập trung với khả năng giám sát này đang được triển khai nhanh hơn nhiều so với các công nghệ crypto.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận