Kiếm 200 đô la mỗi ngày bằng cách sử dụng trí tuệ nhân tạo để dự đoán thời tiết.

Bài viết này được dịch máy
Xem bản gốc

Tác giả: Changan | Đội ngũ nội dung Biteye

Thời tiết không giống như một cuộc bầu cử; nó không có lập trường cụ thể nào. Nó cũng không giống như giải bóng rổ NBA; nó không có đội bóng yêu thích. Nhưng chính thị trường này lại thu hút một lượng lớn người dùng trong nước. Lý do rất đơn giản: mỗi người đều có trải nghiệm riêng, và ai cũng nghĩ mình hiểu về thời tiết Thượng Hải.

Nhưng "cảm thấy mình hiểu vấn đề" và "có thể kiếm được tiền" là hai chuyện hoàn toàn khác nhau.

Hôm nay Biteye chia sẻ ba điều:

  1. Hiểu rõ các quy tắc quyết toán

  2. Thiết lập phương pháp dự báo thời tiết

  3. Hãy sử dụng hệ thống này để tìm kiếm những cơ hội giao dịch mà người khác không thể nhìn thấy.

Trước tiên, chúng ta cần tìm hiểu xem thị trường thời tiết thực sự quyết toán như thế nào.

1. Nhiệt độ mà chất lỏng quyết toán không giống như bạn nghĩ.

Nhiều người tham gia lần thường có hiểu lầm: họ sử dụng ứng dụng thời tiết trên điện thoại để đặt cược vào nhiệt độ cao nhất, nhưng ứng dụng đó lại hiển thị nhiệt độ ở trung tâm thành phố Thượng Hải. Polymarket quyết toán dữ liệu đo thực tế từ sân bay Thượng Hải Pudong (trạm thời tiết ZSPD) để thanh toán. Dữ liệu này được công khai thông qua Wunderground, một nền tảng thời tiết của Mỹ. PM trực tiếp đọc các bản ghi trên WU để làm cơ sở quyết toán.

Hai địa điểm, hai con số. Sân bay Pudong nằm ở phía đông thành phố, sát cửa sông Dương Tử. Do ảnh hưởng của gió biển, nhiệt độ ở đây thường thấp hơn so với trung tâm thành phố. Sự khác biệt này thường không đáng kể, nhưng vào thời điểm quan trọng của một cuộc cá cược, nó có thể là sự khác biệt giữa việc đặt cược đúng và đặt cược sai.

Đó là lý do tại sao bạn thấy sự nhầm lẫn kiểu này trong phần bình luận của thị trường thời tiết: "Hôm nay cảm thấy ấm hơn hôm qua, vậy tại sao nhiệt độ cao nhất hiển thị lại thấp hơn?"

2. Các con số thì đúng, nhưng đơn vị không phải là thứ bạn mong đợi.

Dữ liệu của WU được lấy trực tiếp từ các báo cáo METAR hàng giờ (một định dạng điện tín thời tiết được sử dụng trong ngành hàng không dân dụng toàn cầu) do sân bay gửi đến.

Đây là một chi tiết: METAR ghi lại các giá trị số theo độ Fahrenheit, trong khi WU hiển thị trực tiếp con số mà không cần chuyển đổi hoặc hiệu chỉnh.

Hầu hết các hệ thống dự báo thời tiết và mô hình khí tượng đều đưa ra nhiệt độ có kèm theo số thập phân. Độ chính xác của mô hình càng cao, thì chi tiết thô sơ này càng dễ bị bỏ qua.

3. Mô hình nhiệt độ Thượng Hải

Sau khi phân tích dữ liệu gần 1900 ngày từ trạm ZSPD, người ta nhận thấy rằng các giai đoạn có nhiệt độ cao nhất ở Thượng Hải tập trung nhiều hơn dự kiến:

  • Cả bốn mùa đều tập trung cao độ trong khoảng thời gian từ 11:00 đến 13:00.

  • Nồng độ chất này đạt mức cao nhất vào lúc 12:00 trưa mùa hè, chiếm 27,6% tổng nồng độ của cả mùa chỉ trong một giờ.

  • Thời điểm cao điểm vào mùa thu hơi sớm hơn, với 10:00 là một trong những thời điểm có tần suất cao nhất.

Hiểu được các quy luật là bước đầu tiên, nhưng các quy luật không tự vận hành. Điều quan trọng là phải biết khi nào nhiệt độ cao nhất trong ngày sẽ xảy ra, liệu nhiệt độ đó đã bị vượt qua hay chưa, và còn cách bao xa so với mức nhiệt độ mục tiêu.

Vì vậy, tôi đã xây dựng hệ thống này: trước mỗi quyết toán, nó dự đoán chính xác nhất có thể mức độ Celsius mà nhiệt độ cao nhất trong ngày sẽ đạt được.

Hai trong số năm phương pháp, ba trong số đó đã thành công.

Khi các quy tắc thị trường đã rõ ràng, câu hỏi tiếp theo là: làm thế nào để dự đoán nhiệt độ cao nhất trong ngày?

Là một người hoàn toàn không có kinh nghiệm trong lĩnh vực khí tượng học, bước đầu tiên của tôi là hỏi ChatGPT: ngành khí tượng tính toán nhiệt độ cao nhất trong ngày như thế nào và những phương pháp nào đã được thiết lập? ChatGPT đã cung cấp một khung lý thuyết, và Claude đã chuyển khung lý thuyết đó thành mã lập trình. Cùng nhau làm việc, hai AI đã đưa hệ thống hoạt động chỉ trong một cuối tuần.

Tôi đã thử tổng cộng năm phương pháp, nhưng chỉ có ba phương pháp thành công.

Quá trình chạy đã thành công:

1️⃣ Dự báo tích hợp của WC + ECMWF

Để dự đoán nhiệt độ cao nhất, trước tiên cần có dữ liệu. Hai nguồn dữ liệu đã được sử dụng:

  • Weather Company (WC) là một API thời tiết thương mại cung cấp dữ liệu dự báo theo giờ với độ chính xác cao.

  • ECMWF là mô hình thời tiết toàn cầu của Trung tâm Dự báo Thời tiết Tầm trung Châu Âu, có độ nhạy cao hơn đối với các hệ thống thời tiết quy mô lớn.

Cả hai nguồn đều có ưu điểm và nhược điểm riêng, vì vậy chúng được cân nhắc và bình chọn. Tỷ trọng điều chỉnh linh hoạt dựa trên kiểu thời tiết trong ngày: WC đáng tin cậy hơn vào những ngày nắng, trong khi ECMWF đáng tin cậy hơn vào những ngày nhiều mây và có gió mạnh.

2️⃣ Hiệu chỉnh thời gian thực: Tính toán giá trị đỉnh bằng cách sử dụng dữ liệu tăng nhiệt độ

Dự báo được tính toán vào tối qua, nhưng thời tiết đã thay đổi suốt cả ngày. Vì vậy, chức năng mô-đun này là: sử dụng dữ liệu đo thực tế đã được ghi nhận sáng nay để ước tính nhiệt độ cao nhất có thể trong ngày hôm nay.

Nguyên lý hoạt động không phức tạp. Chúng tôi phát hiện ra rằng nhiệt độ ở Thượng Hải tăng nhanh nhất trong khoảng từ 8 đến 9 giờ sáng. Sau khi thu thập được nhiệt độ đo được vào thời điểm này, hệ thống sẽ kiểm tra dữ liệu lịch sử : nhiệt độ trung bình có thể tăng bao nhiêu độ C vào cùng thời điểm và mùa trong quá khứ.

Sau đó, thêm hai điều chỉnh:

  • Càng nhiều mây thì càng giảm giá; mây càng dày, quá trình ấm lên càng bị cản trở.

  • Tốc độ gió cũng được nhân với một hệ số chiết khấu, vì gió mạnh làm tăng tốc độ mất nhiệt. Một "ước tính ngoại suy" được tính toán.

Áp suất không khí, điểm sương và độ ẩm cũng được đưa vào tính toán, nhưng chúng đã bị loại bỏ vì quá trình kiểm tra ngược cho thấy các yếu tố này có tác động nhỏ và tương quan thấp.

Tuy nhiên, chỉ riêng phép ngoại suy thôi là chưa đủ ổn định. Ở đây, chúng ta sử dụng khái niệm hệ số Kalman, đơn giản là trung bình có trọng số giữa kết quả ngoại suy và dự báo ban đầu. Hơn nữa, tỷ trọng này sẽ tự động thay đổi theo thời gian.

  • Vào lúc 6 giờ sáng, phương pháp ngoại suy chỉ chiếm 20%; phần lớn vẫn dựa trên các dự báo.

  • Đến trưa, số bệnh nhân được giới thiệu từ bên ngoài chiếm 72%.

  • Sau 1 giờ chiều, hầu hết các số liệu đo thực tế đều được chấp nhận, chiếm 85%.

Càng về sau, các sự kiện xảy ra ở thời điểm hiện tại càng quan trọng; càng về trước, giá trị tham khảo của các dự báo lịch sử càng lớn.

Sau 2 giờ chiều, hệ thống đánh giá rằng đỉnh điểm có thể đã qua và trực tiếp lấy nhiệt độ cao nhất trong ngày từ dữ liệu lịch sử để chốt kết quả, mà không cần tính toán thêm.

3️⃣ Hôm nay có phải là ngày nhiệt độ tăng cao không?

Đây là mô-đun mang lại sự hài lòng nhất trong toàn bộ hệ thống. Mỗi buổi sáng sớm, nó đưa ra một phán đoán: Nhiệt độ cao nhất hôm nay có cao hơn hôm qua không?

Hàng ngày, từ 2 đến 4 giờ sáng, hệ thống thu thập một loạt dữ liệu khí tượng và đưa chúng vào mô hình này.

  • Sự thay đổi áp suất không khí trong 3 giờ qua và 12 giờ qua.

  • Hướng và tốc độ gió, độ che phủ của mây lúc bình minh

  • Biến động nhiệt độ ngày hôm qua, xu hướng nhiệt độ trong ba ngày qua, và liệu nhiệt độ ngày hôm qua cao hơn hay thấp hơn mức trung bình.

  • Thêm tháng, mùa, ngày trong năm và cho biết hôm qua trời có mưa hay không.

Kết quả đầu ra của mô hình được chia thành năm cấp độ: ngày ấm lên, ngày ấm lên nhẹ, ngày ổn định, ngày lạnh đi nhẹ và ngày lạnh đi, cùng với mức độ tin cậy.

Tuy nhiên, độ chính xác của phương pháp này thay đổi rất nhiều tùy theo mùa.

  • Chính xác nhất vào mùa đông: Khi không khí lạnh tràn đến, áp suất không khí tăng mạnh và gió bắc mạnh lên, tín hiệu cực kỳ rõ ràng, và mô hình có thể nhận biết ngay lập tức.

  • Mùa thu là mùa tồi tệ nhất: các khối khí lạnh và ấm liên tục va chạm, nhiệt độ tăng hôm nay và giảm ngày mai, và các quy luật lịch sử bị phá vỡ nhanh nhất vào mùa này.

Phương pháp loại trừ:

  1. Dự đoán số Fourier

Nỗ lực ban đầu là sử dụng phân tích Fourier để khớp với các mô hình tuần hoàn của nhiệt độ lịch sử nhằm xem liệu nó có thể dự đoán trực tiếp nhiệt độ cao nhất trong ngày hay không.

Kết quả cho thấy phương pháp này chỉ có thể cho biết "nhiệt độ trung bình lịch sử của mùa này". Thời tiết Thượng Hải quá thất thường; phép nội suy Fourier tạo ra một đường cong trung bình mượt mà, chứ không phải là sự biến động thực tế hàng ngày. Sai số là 3,6°C, và đó là sự đánh giá thấp có hệ thống 100%, vì vậy nó đã bị loại bỏ trực tiếp.

  1. Dự đoán đỉnh điểm ERA5

ERA5 là dữ liệu phân tích lại lịch sử toàn cầu từ Trung tâm Khí hậu Châu Âu, được sử dụng để dự đoán thời điểm nhiệt độ cao nhất trong ngày sẽ xảy ra.

Kiểm thử ngược

  • Độ chính xác đạt 59,6% trong vòng 1 giờ.

  • Tỷ lệ chính xác đạt 81,3% trong vòng ≤2 giờ.

Nghe có vẻ ổn, nhưng vấn đề là PM chính xác hơn, và khoảng thời gian để người giao dịch đưa ra phán đoán rất ngắn. Nếu bạn không thể đưa ra phán đoán về thời điểm đỉnh điểm trong vòng nửa giờ, thì tốt hơn hết là nên xem dữ liệu của Polymarket. Vì vậy, phương pháp này đã bị loại bỏ.

III. Thực hành hệ thống: Hai nghiên cứu trường hợp và suy ngẫm về những thiếu sót

Thị trường thời tiết của Polymarket mở cửa giao dịch trước bốn ngày, và các khoảng nhiệt độ phổ biến thường được định giá đầy đủ từ rất sớm. Việc mua trực tiếp ở các khoảng nhiệt độ có xác suất cao có tỷ lệ rủi ro/lợi nhuận thấp.

Do đó, chiến lược tôi áp dụng là chờ đợi tín hiệu và khung thời gian thích hợp sau khi thị trường nóng lên trước khi tham gia.

Do đó, dựa trên hệ thống thời tiết tự xây dựng, hai thao tác sau đây đã được thực hiện:

Trường hợp 1:

Sáng sớm ngày 16, kênh Telegram đã đưa ra một báo cáo đêm: ngày mai trời sẽ mát hơn. Lý do được đưa ra là lượng mây đêm đó khá dày, và cả đặc điểm theo mùa lẫn theo năm đều cho thấy xu hướng mát mẻ hơn.

Tại thời điểm này, tôi không đặt cược ngay lập tức. Tín hiệu từ sáng sớm chỉ là lớp tham khảo đầu tiên.

Vào lúc 11 giờ sáng, hệ thống đã đưa ra báo cáo thời gian thực về giai đoạn ấm lên. Tại thời điểm đó, nhiệt độ cao nhất thực tế đo được đã đạt 12°C, và điểm xác suất +1°C cho thấy: xác suất tăng thêm 1°C trong ngày hôm nay là 42%, nghiêng về khả năng không ấm lên thêm nữa.

Kết hợp tín hiệu làm mát từ mô hình hồi quy logistic sáng sớm, và với cả hai mô-đun cùng chuyển động theo một hướng, tín hiệu trở nên rõ ràng hơn nhiều so với sáng sớm. Do đó, tôi dự đoán nhiệt độ cao nhất vào ngày 16 sẽ không vượt quá 13°C.

Quyết toán hàng ngày: 12°C. Nhiệt độ hôm trước, ngày 15, là 15°C, như vậy là đã giảm 3 độ.

Trường hợp 2:

Ví dụ, về thời tiết Thượng Hải hôm nay, ngày 17, hệ thống thời tiết thậm chí còn đóng vai trò như một hệ thống cảnh báo sớm: thông báo đẩy nhận được lúc 7:00 sáng cho thấy thời điểm cao điểm bất thường: 22:00.

Thông thường, nhiệt độ cao nhất vào một ngày nắng thường rơi vào khoảng từ 1 đến 3 giờ chiều, nhưng hôm nay nhiệt độ cao nhất lại vào lúc 10 giờ tối, cho thấy điều này không phải do ánh nắng mặt trời làm ấm không khí, mà là do sự vận chuyển không khí ấm và ẩm trong đêm. Trời mưa cả ngày, mây che phủ 97-100% và hầu như không có nắng.

Đến lúc này, khi mở ứng dụng Polymarket ra, người ta thấy giá nước ngọt 12°C vẫn ở mức 53%. Một số người trong cộng đồng tỏ ra khó hiểu: "Đã là buổi chiều, nhiệt độ chỉ có 11°C, giờ cao điểm bình thường đã qua từ lâu, tại sao mọi người vẫn mua nước ngọt 12°C?"

Nguyên nhân dẫn đến sự nhầm lẫn này là do mọi người vẫn đang sử dụng logic của những ngày nắng để đánh giá thị trường vào những ngày mưa.

Hệ thống sẽ không bị nhầm lẫn. Nó đã xác định được kiểu thời tiết hôm nay vào sáng nay, ghi nhận thời điểm đạt đỉnh bất thường và sự chênh lệch đáng kể giữa nhiệt độ hiện tại và kỳ vọng của thị trường. Đây là một khoảng trống thông tin, và khoảng trống thông tin chính là cơ hội giao dịch.

Đây chính là ý nghĩa quan trọng của việc xây dựng hệ thống này: nó giúp dễ dàng hơn trong việc xác định các cơ hội và đưa ra cảnh báo nhanh hơn về rủi ro.

Hệ thống còn có những thiếu sót nào khác?

Một hệ thống được xây dựng chỉ trong một cuối tuần thì không thể nào không có lỗ hổng bảo mật.

  • Tỷ lệ chính xác của dự báo thời tiết mùa thu chỉ đạt 63,7%, gần như là may rủi. Các khối khí lạnh và ấm liên tục va chạm trong mùa này, với nhiệt độ tăng vào một ngày và giảm vào ngày hôm sau; các mô hình lịch sử thường bị phá vỡ nhanh nhất vào mùa thu.

  • Tính năng áp suất khí quyển hiện không khả dụng trong giao dịch thực. Sự thay đổi áp suất khí quyển được sử dụng làm đặc trưng trong quá trình huấn luyện mô hình, và kết quả kiểm thử ngược rất tốt. Tín hiệu về sự di chuyển của không khí lạnh rất rõ ràng. Tuy nhiên, trong giao dịch thực, giao diện hiện tại không thể thu thập dữ liệu áp suất khí quyển theo thời gian thực.

  • Việc hiệu chỉnh ven biển vẫn đang chờ kích hoạt dữ liệu. Hiệu ứng gió biển tại sân bay Pudong là có thật, và hệ thống đã xây dựng một mô-đun hiệu chỉnh tương ứng, nhưng kích thước mẫu kiểm thử ngược vẫn chưa đủ.

Việc phát hiện ra những lỗi này trên một hệ thống chỉ mới hoạt động được một cuối tuần đã là một thành công. Chúng tôi sẽ tiếp tục khắc phục chúng trong quá trình vận hành hệ thống.

Phần kết luận

Ngành khí tượng học đã phát triển qua nhiều thế kỷ, sử dụng vệ tinh, siêu máy tính và các mô hình toàn cầu, nhưng dự báo thời tiết vẫn không thể đảm bảo độ chính xác 100% cho ngày mai. Điều này không phải vì các nhà khoa học chưa đủ nỗ lực; mà là do hệ thống khí quyển vốn rất hỗn loạn, và chỉ cần chênh lệch một độ trong điều kiện ban đầu cũng có thể dẫn đến kết quả hoàn toàn khác biệt.

Hệ thống này, chỉ hoạt động trong một cuối tuần, chắc chắn sẽ mắc sai sót. Độ chính xác của nó vào mùa thu gần giống như tung đồng xu; nếu không khí lạnh đến sớm, hệ thống có thể không phản ứng kịp thời; và ảnh hưởng của gió biển vẫn chưa được nắm bắt đầy đủ.

Nhưng điều đó không quan trọng. Bạn không cần phải đúng lần dự đoán thị trường; bạn chỉ cần có thêm một lớp thông tin so với thị trường khi tỷ lệ thắng nghiêng về phía bạn.

Thị trường thời tiết Thượng Hải vẫn đang trong giai đoạn đầu và chúng tôi sẽ tiếp tục theo dõi và hoàn thiện hệ thống khi nó phát triển. Nếu bạn cũng đang làm việc trên thị trường thời tiết Polymarket, hãy thoải mái thảo luận trong phần bình luận: Bạn sử dụng phương pháp nào để xác định điểm vào lệnh? Bạn đã gặp phải những kết quả quyết toán bất ngờ nào?

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
1
Bình luận