Trong bối cảnh cuộc đối đầu quân sự trực tiếp đang diễn ra giữa Israel và Iran, chúng tôi đã yêu cầu bảy mô hình AI phân tích các kết quả tiềm năng bằng chức năng tìm kiếm trên web, kích hoạt khả năng lý luận sâu sắc và hoạt động như chuyên gia về địa chính trị, chiến tranh toàn cầu và xung đột Trung Đông.
Sáu trong bảy mô hình dự đoán chiến tranh liên tục, gián đoạn thay vì đột phá ngoại giao hoặc Thế chiến thứ III. Chỉ có ChatGPT chuyển sang chế độ John Lennon hoàn toàn và dự báo giải pháp đàm phán nhanh chóng. Các mô hình đồng ý về các yếu tố hạn chế chính: hậu quả thảm khốc của chiến tranh toàn diện, sự miễn cưỡng của Hoa Kỳ đối với sự tham gia trực tiếp và các tính toán sống còn hợp lý của cả hai bên.
Các cảnh báo chung bao gồm rủi ro tính toán sai, tính cấp bách của mốc thời gian hạt nhân và khả năng các nhóm ủy nhiệm kích hoạt leo thang không mong muốn. Dự đoán mốc thời gian dao động từ ba đến 24 tháng xung đột kéo dài, cường độ thấp.
Như Manus, một trong những hệ thống AI “đặc vụ” đầu tiên đã tóm tắt: "Căng thẳng gia tăng nhưng có thể kiểm soát được: Ngôn từ thường mang tính hiếu chiến, nhưng hành động vẫn ở dưới Threshold của một cuộc chiến tranh mở quy mô lớn". Consensus của AI cho rằng cuộc chiến trong bóng tối sẽ tiếp tục diễn ra giữa ban ngày—bạo lực hơn trước, nhưng vẫn được chi phối bởi bản năng răn đe lẫn nhau và sinh tồn.
Sau đây là dự đoán chi tiết hơn của từng mô hình:
Gemini đã đưa ra đánh giá toàn diện nhất, tổ chức phân tích của mình thành các kịch bản chi tiết với bối cảnh lịch sử mở rộng. Mô hình đã xác định ba quỹ đạo chính với các đánh giá xác suất cẩn thận.
Đối với kịch bản có xác suất cao nhất của mình—"leo thang kéo dài, có kiểm soát"Gemini cho biết: "'Sự kiểm soát' trong kịch bản này là tương đối và phải chịu sự hiệu chỉnh liên tục của cả hai bên, khiến tình hình trở nên bất ổn và khó lường. Mỗi chu kỳ leo thang trong kịch bản này sẽ tiếp tục thử thách các ranh giới đỏ và có khả năng làm xói mòn các hạn chế hiện có."
Mô hình này tham chiếu đến học thuyết "cắt cỏ" của Israel, mô tả các hoạt động quân sự định kỳ được thiết kế để làm suy yếu các mối đe dọa bằng các cuộc tấn công nhỏ nhưng liên tục. Gemini dự đoán mô hình này sẽ tiếp tục trong 12-24 tháng, cảnh báo rằng "hiệu ứng tích lũy của các cuộc tấn công và trả đũa liên tục cũng có thể dẫn đến sự xói mòn các ranh giới đỏ được tôn trọng trước đây".
“Mặc dù kịch bản 'leo thang kéo dài, có kiểm soát' được cho là có khả năng xảy ra nhất, nhưng điều quan trọng là phải nhận ra rằng đây không phải là trạng thái ổn định hoặc lành tính. Nó ngụ ý trạng thái căng thẳng cao độ dai dẳng, đặc trưng bởi các cuộc tấn công quân sự định kỳ, các hoạt động bí mật, chiến tranh mạng và các cuộc giao tranh ủy nhiệm”, báo cáo cảnh báo.
Claude tiếp cận cuộc khủng hoảng giống như một nhà phân tích quân sự hơn là một nhà ngoại giao, chỉ định các xác suất cụ thể và xác định các chỉ số cụ thể cho từng kịch bản. Mô hình đưa ra mức xác suất 50-60% cho "chiến dịch quân sự kéo dài".
"Iran không thể chấp nhận sự suy thoái của chương trình hạt nhân mà không có phản ứng, trong khi Israel coi thời điểm hiện tại là tối ưu cho hành động quyết định", Claude tuyên bố. Mô hình này nhấn mạnh một yếu tố quan trọng: "Khả năng kỹ thuật của Iran trong việc nhanh chóng vũ khí hóa tạo ra tiềm năng cho sự thay đổi chiến lược đột ngột có thể ngăn chặn hành động tiếp theo của Israel hoặc gây ra sự leo thang phủ đầu".
Phân tích của Claude bao gồm các dấu hiệu cảnh báo cụ thể cần theo dõi, từ các nỗ lực đóng cửa Eo biển Hormuz đến việc tăng tốc làm giàu uranium. Mô hình lưu ý rằng "khả năng đột phá trong 25 ngày" của Iran cung cấp cả "đòn bẩy leo thang và tính cấp bách cho hành động quyết định".
ChatGPT đưa ra đánh giá lạc quan nhất, xếp hạng giải pháp ngoại giao là "có khả năng cao" mặc dù thừa nhận những rủi ro quân sự nghiêm trọng. Mô hình phác thảo cách leo thang có thể diễn ra nhưng luôn quay trở lại với khả năng đàm phán.
"Sự trả đũa ban đầu của Tehran mang tính biểu tượng dữ dội nhưng cuối cùng có hiệu lực hạn chế, cho thấy sự miễn cưỡng leo thang đến điểm không thể quay lại. Thực tế là Iran đã nhờ đến Liên Hợp Quốc và đang tham gia ngoại giao (kể cả chỉ để lên án Israel) cho thấy họ không đóng sầm cánh cửa trên con đường chính trị", ChatGPT nhận xét. Mô hình này hình dung ra "các cuộc đàm phán lặng lẽ có thể được làm trung gian bởi Oman hoặc Qatar, nơi Iran đồng ý hạn chế nghiêm ngặt chương trình hạt nhân của mình".
ChatGPT trích dẫn tuyên bố của Tổng thống Trump rằng "chưa quá muộn" để đạt được thỏa thuận, coi đây là bằng chứng cho thấy "Washington sẵn sàng làm trung gian cho một giải pháp như vậy thay vì theo đuổi mục tiêu phá hủy chế độ". Mô hình dự đoán giải pháp sẽ có trong vòng vài tuần thông qua "một sự thỏa hiệp - có thể là một thỏa thuận hạt nhân được cập nhật".
Chế độ nghiên cứu của Grok có vẻ đã giảm hiệu suất trong những tuần gần đây. Chúng tôi đã kích hoạt “Tìm kiếm sâu hơn”, được cho là sử dụng nhiều tài nguyên hơn cho báo cáo mở rộng hơn. Tuy nhiên, mô hình đã đưa ra phân tích siêu súc tích tập trung vào các mô hình lịch sử và các chỉ số thực tế. Mô hình đánh giá “xung đột hạn chế” là có khả năng cao dựa trên tiền lệ.
"Israel và Iran đã tham gia vào các cuộc xung đột ủy nhiệm và hạn chế các cuộc tấn công trực tiếp trong nhiều thập kỷ, tránh chiến tranh toàn diện do răn đe lẫn nhau và áp lực quốc tế", Grok lưu ý. Mô hình dự kiến 3-6 tháng "bùng nổ định kỳ các cuộc không kích, tấn công tên lửa hoặc các cuộc giao tranh ủy nhiệm".
Grok đã xác định những yếu tố bất định cụ thể bao gồm "một cuộc tấn công tên lửa thành công của Iran gây ra thương vong đáng kể cho Israel có thể dẫn đến phản ứng không cân xứng" và "sự ủng hộ gia tăng của các quốc gia vùng Vịnh hoặc Nga". Mô hình nhấn mạnh rằng "cả Israel và Iran đều hành động hợp lý, ưu tiên sự sống còn hơn các mục tiêu ý thức hệ".
Manus, một trong những mô hình agentic đầu tiên, là một điều bất ngờ. Nó không chỉ thực hiện một báo cáo nghiên cứu đầy đủ mà còn có thể tạo ra một trang web để dễ hiểu hơn và cho phép chúng ta xem theo thời gian thực trong quá trình nghiên cứu.
Với tư cách là một chuyên gia, Manus đã cố gắng đưa ra đánh giá sắc thái hơn về động lực xung đột ở Trung Đông, xếp hạng "leo thang có kiểm soát và chiến tranh ngầm gia tăng" ở mức có khả năng xảy ra ở mức trung bình đến cao trong vòng 12-24 tháng.
"Kịch bản này phản ánh mô hình đối đầu lịch sử giữa Israel và Iran, nơi cả hai bên đều tìm cách gây thiệt hại và ngăn chặn lẫn nhau mà không gây ra một cuộc chiến tranh toàn diện mà không bên nào có thể chịu đựng được", Manus giải thích. Mô hình dự đoán Israel sẽ "tiếp tục thực hiện các hoạt động bí mật và các cuộc không kích có chọn lọc", trong khi Iran sẽ đáp trả "bằng sự kết hợp của tên lửa và máy bay không người lái, và thông qua các lực lượng ủy nhiệm của mình".
Manus nhấn mạnh các kênh truyền thông: "Mặc dù không có đối thoại trực tiếp, người ta cho rằng có các kênh gián tiếp (thông qua các quốc gia thứ ba hoặc tình báo) cho phép cả hai bên trao đổi 'ranh giới đỏ' và tránh những hiểu lầm thảm khốc".
DeepSeek của Trung Quốc không có chế độ nghiên cứu, nhưng chúng tôi đã kết hợp tìm kiếm trên web với khả năng suy luận. Kết quả là một phân tích dữ liệu nặng, chỉ định "xung đột bí mật kéo dài" có xác suất 60%.
Dòng thời gian bao gồm các dự đoán chi tiết: "Ngắn hạn (0-3 tháng): Các cuộc tấn công khủng bố của Iran ở châu Âu; Israel không kích các nhà máy tên lửa. Trung hạn (4-12 tháng): Chiến tranh mạng leo thang; IAEA xác nhận Iran ngừng làm giàu uranium."
DeepSeek lưu ý những hạn chế, bao gồm việc "Iran thiếu năng lực thông thường để tiến hành chiến tranh trực tiếp (lực lượng không quân lạc hậu; lực lượng ủy nhiệm suy yếu)" và "Hoa Kỳ tránh tham gia trên bộ; tập trung vào việc bảo vệ lực lượng".




