"Hôm nay bạn đã hỏi ChatGPT chưa?" Khi câu hỏi này phổ biến như "Bạn đã ăn chưa?", OpenAI lặng lẽ công bố một loạt số liệu đủ khiến bất kỳ nhà quản lý sản phẩm nào cũng phải mất ngủ: ChatGPT nhận được 2,5 tỷ lệnh người dùng mỗi ngày, 912,5 tỷ lần mỗi năm, tương đương Lần"ding dong" mỗi giây. Nếu bạn hình dung mỗi câu hỏi là một lượt tìm kiếm, thì ChatGPT đã chiếm 18% lượng tìm kiếm hàng năm của Google (5 nghìn tỷ lần), và khoảng cách này đang thu hẹp với tốc độ rõ rệt.
Điều thậm chí còn hấp dẫn hơn nữa là vào cùng ngày OpenAI công bố dữ liệu, họ cũng giới thiệu một tính năng mới có tên là ChatGPT Agent cho người dùng Pro, không chỉ có thể trả lời câu hỏi mà còn có thể "hành động". Một cuộc chiến bí mật về "từ câu trả lời đến hành động" đã bắt đầu.
Đằng sau 2,5 lần câu hỏi: Khoảnh khắc “nước, điện và than” của AI
2,5 tỷ lần mỗi ngày có ý nghĩa gì? Điều này đã giúp tăng số lượng người dùng hoạt động hàng tuần của ChatGPT từ 300 triệu lên 500 triệu người trong nửa năm, một tốc độ tăng trưởng tương đương với mức tăng trưởng nhanh nhất của TikTok vào năm 2018. Người dùng Mỹ đóng góp 13% số câu hỏi được hỏi, nhưng lại hỗ trợ hơn 60% thu nhập trả phí của OpenAI - sự cân bằng tinh tế giữa tường phí và trải nghiệm miễn phí được thể hiện rõ qua dữ liệu. So với mức trung bình 14 lần lượt tìm kiếm mỗi ngày của Google, các câu hỏi của ChatGPT "nặng ký" hơn: lần 3,7 vòng, thời gian dừng là 4 phút 12 giây, trong khi phiên tìm kiếm trung bình trên Google chỉ là 26 giây. Nói cách khác, người dùng không "tìm kiếm" mà là "trò chuyện".
Khi việc đặt câu hỏi trở thành thói quen, bước tiếp theo là “để AI làm điều đó thay tôi”. Đây chính là bối cảnh để Agent xuất hiện.
Nhân viên ChatGPT: Thực tập sinh ngày đầu tiên hay trợ lý siêu cấp tương lai?
Phóng viên The Verge đã chi 200 đô la để đăng ký phiên bản Pro và ngay lập tức đưa Agent vào "trận chiến thực sự":
1. Mua một chiếc đèn cổ điển Nhật Bản với giá dưới 200 đô la. Nhân viên bán hàng đã dành 50 phút để tìm kiếm, so sánh giá cả, lọc và thêm sản phẩm vào giỏ hàng trên Etsy, nhưng cuối cùng, sản phẩm chỉ được đưa vào giỏ hàng "máy ảo" - khi phóng viên đăng nhập, giỏ hàng trống trơn.
2. Đặt hoa cho một người bạn ở Colorado. Nhân viên đã kiểm tra bốn cửa hàng hoa địa phương và thậm chí còn đưa ra lựa chọn "giao hàng trước thứ Bảy", nhưng ở bước cuối cùng, "Rất tiếc, tôi không thể đặt lệnh trực tiếp."
3. Cho phép Đại lý đăng nhập vào tài khoản ngân hàng để thiết lập chuyển khoản tự động. Trực tiếp nhận được thông báo lỗi màu đỏ: "Rất tiếc, tôi không thể hỗ trợ loại nhiệm vụ này."
Yash Kumar, giám đốc sản phẩm tại OpenAI, không hề né tránh sự thật rằng "chúng tôi đang tối ưu hóa để hoàn thành nhiệm vụ, chứ không phải độ trễ". Isa Fulford, trưởng nhóm nghiên cứu, USD: "Ngay cả khi mất nửa giờ, nó vẫn nhanh hơn so với việc bạn tự mình làm". Nói một cách ngắn gọn, Agent được định vị như một "thực tập sinh hậu trường": bạn có thể đi uống một tách cà phê, nó sẽ từ từ chạy quy trình và khi quay lại, nó sẽ cung cấp cho bạn một báo cáo có thể không sử dụng được 100%.
Nhưng đừng vội cười. Vào năm 2004, tìm kiếm trên Google thường trả về 404 và vào năm 2011, Siri đã bị chỉ trích là "chậm phát triển nhân tạo". Bất kỳ sản phẩm nào ở cấp độ cơ sở hạ tầng cũng sẽ gặp rắc rối vào ngày đầu tiên. Chìa khóa nằm ở những "khả năng" mà Agent đã mở ra: lần, nó đưa Operator (nhấn trang web) và Deep Research (lập luận nhiều bước) vào cùng một mô hình và có thể xem hình ảnh, lật trang, viết mã và chạy tập lệnh trên thiết bị đầu cuối; nó chạy trong một vùng chứa đám mây bị cô lập và máy tính cục bộ chỉ là "hình chiếu màn hình", điều đó có nghĩa là trong tương lai, ngay cả khi bạn tắt máy tính, Agent vẫn có thể giúp bạn chạy 100 trang chú thích báo cáo tài chính suốt đêm; OpenAI đã nhúng sẵn "chế độ giám sát" và "xác nhận hoạt động không thể đảo ngược" để giữ nhiệm vụ rủi ro cao như tài chính, y học và luật pháp ra khỏi hàng rào trước - hãy tìm kiếm sự ổn định trước, sau đó là tốc độ.
Cuộc chiến trình duyệt: AI sẽ trở thành thanh địa chỉ mới
Reuters đưa tin OpenAI sẽ phát hành trình duyệt AI dựa trên Chromium trong "vài tuần tới". Điều gì sẽ xảy ra nếu bạn đặt Agent vào thanh địa chỉ?
Khi bạn nhập "Đặt bàn cho hai người tại một nhà hàng Ý vào lúc 7 giờ tối thứ Sáu tuần này", trình duyệt không còn chuyển hướng bạn đến 10 trang nữa mà thay vào đó sẽ trực tiếp hiển thị danh sách đặt chỗ trên OpenTable với xếp hạng, khoảng cách và thực đơn chất gây dị ứng.
Khi bạn mở báo cáo tài chính PDF, nhân viên bán hàng sẽ kéo dữ liệu chính vào Excel và tạo biểu đồ theo năm. Khi bạn thấy "Vui lòng giới thiệu vỏ máy tính Sea View màu trắng dưới 5.000 nhân dân tệ" trên Reddit, nhân viên bán hàng sẽ tự động so sánh giá trên JD.com và Taobao, đồng thời tạo dòng thời gian về giá thấp lịch sử, phiếu giảm giá và các đợt giảm giá chớp nhoáng hôm nay.
Nói một cách triệt để hơn: nếu trang chủ mặc định của trình duyệt không còn là Google.com nữa mà là ChatGPT.com, mô hình quảng cáo đấu thầu của Google sẽ bị cắt đứt. Hệ thống bảo vệ của Chrome chính là "thị phần công cụ tìm kiếm mặc định". Một khi Agent có thể bỏ qua khâu tìm kiếm và đi thẳng đến kết quả, cỗ máy in tiền của Google sẽ mất một bánh răng.
Ba sự hồi hộp lớn của cuộc cách mạng chậm
1. Khoảng cách về độ tin cậy: Hiện tại, tỷ lệ thành công của Agent là khoảng 75%, mức chấp nhận được đối với các tình huống có khả năng chịu lỗi cao như "mua hoa". Tuy nhiên, khi liên quan đến các vấn đề y tế, pháp lý và tài chính, một sai sót có thể dẫn đến kiện tụng. OpenAI cần tìm ra một điểm tối ưu Pareto mới giữa các rào cản và năng lực.
2. Kinh tế tỷ lệ băm: 2,5 lần câu hỏi đã tiêu tốn của OpenAI 4 tỷ đô la tỷ lệ băm mỗi năm. Nếu Agent có thể kéo dài thời lượng trung bình của lần nhiệm vụ lên 30 phút, số lượng mã thông báo suy luận sẽ tăng theo cấp số nhân - trừ khi hiệu quả của mô hình được cải thiện đáng kể, phí đăng ký sẽ phải tăng.
3. Phân bổ lại quyền lực: Giám đốc điều hành Instacart, Fidji Simo, sẽ sớm được bổ nhiệm vào OpenAI để phụ trách bộ phận "ứng dụng". Nhiệm vụ của cô là tìm ra "kịch bản đột phá" cho Agent, để AI không chỉ là một món đồ chơi công nghệ, mà còn là một nhu cầu thiết yếu của công chúng, giống như dịch vụ giao đồ ăn và taxi. Nói cách khác, bất cứ ai có thể định nghĩa được mô hình tương tác của "siêu trợ lý" sẽ nắm giữ tấm vé bước vào thập kỷ tiếp theo.
Lần sau "Google it" có biến mất không?
Năm 2004, trước khi Google niêm yết, không ai tin rằng hộp tìm kiếm có thể Sự lật đổ cổng thông tin; năm 2012, khi WeChat ra mắt tài khoản công khai, không ai tin rằng trò chuyện có thể thay thế trình duyệt. Ngày nay, ChatGPT Agent vẫn còn vụng về, chậm chạp, và thậm chí còn hơi dễ thương, nhưng lần, nó đã rút ngắn con đường từ "vấn đề đến hành động" xuống còn một câu.
Có lẽ năm năm nữa, chúng ta sẽ nhớ những ngày "nhấp chuột vào mười tab để so sánh giá" nhiều như chúng ta nhớ Internet dial-up. Và khi trẻ con hỏi "công cụ tìm kiếm là gì", chúng ta sẽ chỉ nhún vai:
“Ồ, đó là thời điểm mà AI chưa thể tự mình làm được mọi việc.”
Bài viết này được trích từ tài khoản công khai WeChat "Shan Zi" , tác giả: Rayking629 và được 36Kr cho phép xuất bản.





