Tôi xin cảm ơn các nhóm Flashbots , Titan và Ultrasound đã vui lòng chia sẻ dữ liệu của họ. Tôi cũng xin cảm ơn nhóm ethPandaOps đã thu thập dữ liệu xác thực và dữ liệu khối đến, đồng thời cung cấp quyền truy cập vào phiên bản ClickHouse của Xatu. Cuối cùng, xin chân thành cảm ơn Thomas Thiery, Anders Elowsson, Barnabé Monnot và Marios Ioannou vì những phản hồi và đề xuất của họ.
Tóm lại
Phân tích này xem xét thời gian đến của các khối và chứng thực và bao gồm 1 tuần các khe Ethereum từ đầu tháng 8 năm 2025. Mục đích của phân tích này là đánh giá tính khả thi của EIP-7782 , đề xuất giảm khe xuống còn 6 giây bằng cách đặt thời hạn chứng thực thành 3 giây và thời hạn tổng hợp thành 4,5 giây.
Các khối thường đến gần thời hạn xác nhận (phân vị thứ 95 là 3,3 giây). Tuy nhiên, thời gian lan truyền khối thuần túy (được định nghĩa là thời gian trôi qua kể từ khi khối được phát hành bởi một rơle) là dưới 1 giây. Trong một mẫu các khe thời gian mà khối đến từ Ultrasound, Flashbots hoặc Titan, phân vị thứ 95 là khoảng 800ms. Điều này cho thấy thời điểm bắt đầu của khe thời gian không chỉ được sử dụng để lan truyền khối, và có thể có một số khoảng trống trong thời gian xác nhận trong cấu trúc khe thời gian hiện tại.
Xác nhận cho các khe bị bỏ lỡ, cho thấy thời gian lan truyền thuần túy, trung bình xuất hiện sau 831ms kể từ mốc 4 giây. Siêu đa số mạng con hình thành trong vòng chưa đầy 830ms, trong khi phân vị thứ 95 mất 1962ms.
Đối với các khe thời gian mà tiêu đề bắt nguồn từ một rơle, các xác nhận sẽ đến trong vòng chưa đầy 4,5 giây sau khi khối được rơle công bố (vẫn thấp hơn thời hạn tổng hợp 4,5 giây được đề xuất cho các khe thời gian sáu giây). Việc phân phối được thực hiện theo hai chế độ, với các chế độ khoảng 1,2 giây và 3 giây. Nguồn gốc của hai chế độ này là thực thể thực hiện xác nhận. Điều này có thể do kết nối mạng, chiến lược xác nhận hoặc cấu hình sai.
Các thực thể xác thực là yếu tố tác động mạnh nhất đến việc xác thực trễ. Một số nhà điều hành thường xuyên báo cáo trễ hơn những nhà điều hành khác, và chỉ cần một thực thể được cấu hình sai cũng có thể làm sai lệch đáng kể kết quả. Nội dung khối cũng quan trọng: mức sử dụng gas cao hơn và nhiều blob hơn làm tăng khả năng trễ.
Giới thiệu
Báo cáo này bao gồm các kết quả chính từ việc phân tích khối và dữ liệu xác thực được thu thập từ các nút Ethereum giữa các vị trí 12243599 và 12293998, tương ứng với khoảng một tuần các vị trí trong tuần đầu tiên của tháng 8 năm 2025.
Mục tiêu của phân tích này là thu thập hiểu biết ban đầu về tính khả thi của EIP-7782 , đề xuất giảm thời gian xuống còn 6 giây bằng cách chuyển thời hạn chứng thực xuống còn 3 giây và thời hạn tổng hợp xuống còn 4,5 giây.
Phân tích của chúng tôi tập trung vào ba số liệu khác nhau được minh họa trong sơ đồ bên dưới.
Đầu tiên, chúng ta xem xét thời gian đến của khối. Thời gian đến của khối tương ứng với thời điểm nút beacon lần đầu tiên nhìn thấy khối. Từ thời gian đến của khối này, chúng ta tính toán hai số liệu truyền lan:
- Khoảng thời gian tính bằng mili giây giữa thời điểm khối đến và thời điểm rơle xuất bản tải trọng khối. Chỉ số lan truyền khối này được biểu thị bằng màu vàng trong sơ đồ và nhằm mục đích loại trừ các trò gian lận về thời gian. Tuy nhiên, vì chúng tôi chỉ thu thập dữ liệu từ các rơle Ultrasound, Flashbot và Titan, nên chỉ số này chỉ được báo cáo cho một mẫu nhỏ các khe cắm.
- Số mili giây giữa thời gian đến của khối và thời gian bắt đầu của khe. Vì số liệu này không yêu cầu dữ liệu chuyển tiếp, chúng ta có thể báo cáo toàn bộ mẫu khe. Tuy nhiên, do các trò chơi tính thời gian và logic xây dựng khối, số liệu này ước tính quá cao thời gian lan truyền thực tế cần thiết.
Thứ hai, chúng tôi phân tích các xác nhận cho các khe thời gian bị bỏ lỡ. Trong các khe thời gian này, tải trọng khối không bao giờ được cung cấp, và do đó, chúng tôi biết rằng các trình xác nhận đã đợi đến thời hạn 4 giây để xác nhận. Điều này cho phép chúng tôi tính toán thời gian lan truyền xác nhận thuần túy bằng cách lấy thời gian xác nhận đến nút beacon trừ đi 4 giây. Đây là thành phần màu xanh nhạt trong sơ đồ trên.
Chỉ số thứ ba và cũng là chỉ số cuối cùng cố gắng ước tính tổng thời gian cần thiết để truyền khối qua lớp P2P, bao gồm thực thi, xác thực và truyền chứng thực. Chỉ số này tương ứng với các thành phần màu vàng, hồng và xanh nhạt của sơ đồ. Tương tự như chỉ số truyền khối, chúng tôi tính toán thời gian đến của chứng thực kể từ khi khối được rơle xuất bản, để tính đến các trò chơi về thời gian. Chúng tôi sử dụng cùng thời gian xuất bản được chia sẻ bởi các rơle Ultrasound, Flashbot và Titan như trong chỉ số truyền khối.
Thu thập dữ liệu
- Thời gian xuất bản tiếp sức được cung cấp bởi các nhóm tại Flashbots , Titan và Ultrasound . Các tập dữ liệu chứa số mili giây kể từ khi bắt đầu khe thời gian khi tiếp sức trả lời yêu cầu
/eth/v1/builder/blinded_blocks
bằng cách gửi tải trọng khối đến nút beacon. - Thời gian đến của khối được thu thập từ các bảng Luồng Sự kiện API Beacon của Xatu . Các bảng này chứa các sự kiện được tạo bởi các nút nội bộ do nhóm ethPandaOps vận hành và các nút cộng đồng đã chọn chia sẻ số liệu của mình với nhóm ethPandaOps. Một mặt, việc bao gồm dữ liệu cộng đồng cung cấp một nhóm nút beacon và vị trí địa lý rộng hơn nhiều. Tuy nhiên, điều này đi kèm với một nhược điểm - dữ liệu dễ bị lỗi hơn vì không thể được xác thực. Truy vấn SQL để thu thập dữ liệu có thể được tìm thấy trong
beacon_blocks.sql
. - Các thông tin xác thực đến được thu thập từ các bảng P2P của Lớp Đồng thuận của Xatu . Chúng tôi đã lọc dữ liệu để chỉ bao gồm các tin nhắn được tạo bởi một tập hợp các nút do nhóm ethPandaOps quản lý, đang chạy một nhánh của máy khách đồng thuận Prysm được thiết kế để thu thập dữ liệu liên quan đến P2P. Logic để thu thập dữ liệu cho các khe bị bỏ lỡ có thể được tìm thấy trong
atts_missed_runner.py
. Logic để thu thập dữ liệu cho các khe chuyển tiếp có thể được tìm thấy trongatts_sample_runner.py
. - Ánh xạ giữa ID trình xác thực và thực thể trình xác thực được thu thập từ ethseer.io . Dữ liệu này có thể được truy vấn trực tiếp từ phiên bản ClickHouse của Xatu bằng cách sử dụng bảng
ethseer_validator_entity
. Chúng tôi đã triển khai truy vấn này trong hàm get_validator_ethseer_info .
Khối lan truyền
Trong số 51.139 vị trí trong tập dữ liệu của chúng tôi, 47,6% không có dữ liệu chuyển tiếp. Các vị trí này được cung cấp bởi các rơle khác hoặc do chúng tôi tự xây dựng. 41,3% còn lại được công bố bởi Ultrasound, 5,8% bởi Flashbots và 5,3% bởi Titan. Đối với mỗi vị trí, chúng tôi có dữ liệu khối đến cho 109 nút cộng đồng và 29 nút nội bộ. Các nút có nhiều khách hàng và khu vực địa lý khác nhau.
Tập trung vào tập hợp con các khe cắm mà chúng ta có dữ liệu chuyển tiếp, chúng ta có thể thấy trong hai biểu đồ sau đây sự phân bố của sự lan truyền khối kể từ khi khối được xuất bản, được chia theo máy khách nút và quốc gia nút. Biểu đồ hộp hiển thị ba tứ phân vị trong các ô màu và sự biến thiên bên ngoài tứ phân vị trên và dưới trong các đường kéo dài. Các chấm là các giá trị ngoại lệ.
Có một số biến thể tùy theo máy khách, với Lodestar và Caplin cho thấy thời gian lan truyền dài hơn một chút. Xin lưu ý rằng Caplin là máy khách đồng thuận được nhúng trong máy khách thực thi Erigon. Nó hoạt động giống như bất kỳ máy khách đồng thuận nào khác, nhưng được tích hợp hoàn toàn vào lớp thực thi.
Các quốc gia cũng khác nhau, với Hà Lan cho thấy sự phân bố lệch đáng ngạc nhiên. Tuy nhiên, Hà Lan chỉ có 99 quan sát trong tập dữ liệu của chúng tôi, trong khi các quốc gia còn lại có từ 45 đến 50 nghìn quan sát, do đó mẫu có thể không mang tính đại diện. Sau Hà Lan, Úc, Ấn Độ và Nigeria cho thấy thời gian lan truyền dài hơn.
Bất kể các biến thể quan sát được, hầu hết các nút vẫn nhận được khối trong vòng chưa đầy 1 giây. Phân vị thứ 95 của tốc độ lan truyền khối kể từ khi khối được phát hành bởi rơle là 816 ms đối với các nút nội bộ của Xatu và 804 ms đối với các nút cộng đồng. Biểu đồ sau đây cho thấy CDF của thời gian lan truyền khối kể từ khi khối được phát hành bởi rơle.
Biểu đồ cuối cùng cho thấy sự phân bố thời gian đến của khối kể từ khi bắt đầu khe theo nguồn tiêu đề. Như đã giải thích trước đó, đây là một ước tính quá cao về thời gian lan truyền khối vì nó cũng bao gồm thời gian xây dựng khối và tương tác với mev-boost. Tuy nhiên, nó cho phép chúng ta hiểu được mẫu con của các khe relay so với các khe còn lại như thế nào.
Điều thú vị là các khe không có dữ liệu chuyển tiếp có thời gian lan truyền ngắn hơn một chút, nhưng chúng cho thấy nhiều giá trị ngoại lệ hơn và độ lệch chuẩn lớn hơn. Phân vị thứ 95 tương đương nhau, với các khe "khác" mất 3292ms, trong khi các khe có dữ liệu chuyển tiếp mất 3337ms. Điều này cho thấy thời gian quan sát được với dữ liệu chuyển tiếp có thể là một ước tính hợp lý.
Ngoài ra, việc khối đến rất gần với thời hạn xác nhận trong khi quá trình truyền thực tế mất chưa đến 1 giây cho thấy thời điểm bắt đầu của khe không chỉ được sử dụng cho việc truyền khối. Do đó, có thể có một số khoảng trống trong thời gian xác nhận trong cấu trúc khe hiện tại.
Điều này càng được củng cố bởi mối quan hệ giữa sự lan truyền khối và kích thước khối. Người ta kỳ vọng hai số liệu này có tương quan dương. Tuy nhiên, hệ số tương quan của chúng chỉ là 0,004. Chúng ta cũng có thể thấy mối quan hệ phi tuyến tính của chúng trong biểu đồ phân tán bên dưới.
Để biết thêm các sơ đồ và phân tích, hãy tham khảo sổ ghi chép 2.3-beacon-block-arrivals-with-relay.ipynb .
Thời gian xác nhận cho các vị trí bị bỏ lỡ
Có 207 khe thời gian bị bỏ lỡ trong mẫu của chúng tôi. Với mỗi khe, chúng tôi quan sát các xác nhận từ mạng con 0 và 1. Chúng tôi có ba nút đang lắng nghe cùng một mạng con trên bốn khu vực - Hà Lan, Ấn Độ, Hoa Kỳ và Úc. Biểu đồ sau đây cho thấy sự phân bố chung của tất cả các thời gian lan truyền xác nhận này (tức là mili giây xác nhận đến kể từ mốc 4 giây trong khe thời gian).
Đúng như dự đoán, hầu hết các xác nhận mất chưa đến 1 giây để lan truyền, trung bình là 831ms. Tuy nhiên, chúng tôi thấy một đuôi phải khá lớn trong phân phối, với một số xác nhận đến muộn hơn 1 giây. Trên thực tế, tổng thể phân vị thứ 95 là 2066ms.
Chúng ta nên lưu ý rằng thời gian chúng ta đang thấy có thể là ước tính quá cao. Với các khe thời gian bị bỏ lỡ, tất cả người xác thực đều gửi xác thực của họ cùng một lúc, điều này tạo ra một đợt hoạt động lớn trên lớp P2P. Trong điều kiện bình thường hơn, các xác thực sẽ được gửi chậm hơn vì các trình xác thực mất thời gian hơi khác nhau để nhận và xác thực khối.
Khi xem xét cùng một phân phối theo vùng nút thu (trong biểu đồ hộp bên dưới), chúng ta thấy rằng mặc dù các nút ở Ấn Độ và Úc có thời gian dài hơn một chút, nhưng sự khác biệt không đáng kể (khoảng 100ms).
Một yếu tố quan trọng khác cần cân nhắc khi phân tích chứng thực là nguồn gốc của chứng thực, tức là người chứng thực. Sử dụng ánh xạ từ ethseer.io , chúng tôi đã trích xuất thực thể xác thực của người chứng thực. Sau đó, chúng tôi vẽ biểu đồ thời gian lan truyền trên mỗi thực thể (bên trái) và trọng số của từng thực thể trong các chứng thực đến từng nhóm 50 ms trong khe (bên phải).
Chúng ta đã thấy sự khác biệt đáng kể giữa các thực thể. Với thông tin về cấu hình máy khách và vị trí địa lý, không thể xác định chính xác lý do tại sao một số thực thể lại chậm hơn những thực thể khác.
Một ví dụ đáng chú ý là Kiln. Trong dữ liệu của chúng tôi, họ chịu trách nhiệm cho một tỷ lệ lớn các xác nhận đến trong khoảng từ 1500ms đến 3250ms và họ có thời gian lan truyền trung bình lớn nhất. Sau khi xem những kết quả này, chúng tôi đã liên hệ trực tiếp với họ và họ đã phát hiện ra một lỗi cấu hình trong máy khách của họ, giúp cải thiện đáng kể thời gian của họ. Khi xem xét một mẫu gồm 183 khe bị bỏ lỡ hai tuần sau mẫu chính của chúng tôi (tức là giữa các khe 12344420 và 12394820), chúng tôi quan sát thấy sự giảm sút ở phần trăm thứ 95 tổng thể từ 2066ms xuống 1782ms . Ngoài ra, chúng ta có thể thấy trong biểu đồ bên dưới rằng trọng số của Kiln trong các xác nhận sau đó đã thay đổi đáng kể. Điều này cho thấy tầm quan trọng của việc điều tra kỹ lưỡng hơn các thực thể có xác nhận muộn để cố gắng giải quyết nguyên nhân gốc rễ của sự chậm trễ.
Cho đến nay, chúng tôi đã xem xét sự phân bố dữ liệu trên tất cả các khe và mạng con trong mẫu của mình. Tuy nhiên, một số liệu liên quan khác là phần trăm thứ 66 trên mạng con. Nói cách khác, với một khe và một mạng con, khi nào mạng con đạt được siêu đa số các xác nhận? Phân bố dưới đây minh họa số liệu này trên các khe và mạng con khác nhau trong dữ liệu của chúng tôi. Lưu ý rằng ở đây chúng tôi lấy xác nhận đầu tiên được quan sát thấy cho mỗi người xác nhận (tức là chúng tôi đang sử dụng nút nhanh nhất). Điều thú vị là tất cả các mạng con trong tất cả các khe bị bỏ lỡ mất ít hơn 830ms để đạt được siêu đa số. Giá trị trung bình là 640ms.
Có thể thực hiện phân tích tương tự cho phân vị thứ 95. Phân phối được hiển thị bên dưới. Giá trị trung bình hiện tại là 1572ms, trong khi phân vị thứ 95 là 1962ms.
Để biết thêm biểu đồ và phân tích, hãy tham khảo sổ ghi chép 2.4-committee-attestations-missed-slots.ipyn . Sổ ghi chép 2.5-committee-attestations-missed-slots-v2.ipynb chứa cùng một phân tích, nhưng sử dụng mẫu các khe bị mất 2 tuần sau đó.
Chứng nhận đến
Trong phần phân tích này, chúng tôi đã lấy một mẫu ngẫu nhiên gồm 4963 khe từ cùng các khe với dữ liệu chuyển tiếp được sử dụng trong phần truyền khối. Từ mẫu này, 80,4% có tiêu đề từ Ultrasound, 10,9% từ Flashbots và 8,7% từ Titan. Biểu đồ tiếp theo cho thấy sự phân bố của các lần xác thực đến (được tính bằng mili giây kể từ khi khối được chuyển tiếp công bố) cho tất cả các khe và tất cả các mạng con.
Ở đây, chúng ta có thể thấy một phân phối bimodal rõ ràng, với các mode khoảng 1,2 giây và 3 giây. Điều này có nghĩa là có hai nhóm xác nhận - nhanh và chậm. Nguồn của phân phối bimodal không phải là nguồn tiêu đề (như được hiển thị trong biểu đồ bên dưới, các phân phối khá giống nhau trên các rơle khác nhau) cũng không phải là các khe cụ thể (được chứng minh bằng cùng một xu hướng ở các cấp khe riêng lẻ).
Điều dường như giải thích cho hình dạng hai phương thức này chính là nguồn gốc của các chứng thực, tức là thực thể tạo ra chứng thực. Điều này phù hợp với quan sát của chúng tôi về các khe thời gian bị bỏ lỡ. Tuy nhiên, xu hướng này thậm chí còn rõ rệt hơn đối với thời gian chứng thực đến.
Nếu không có thêm thông tin về người chứng thực, chẳng hạn như cấu hình máy khách và vị trí địa lý, thì không thể xác định chính xác lý do cho hình dạng hai mô hình của chứng thực. Tuy nhiên, có một vài khả năng. Một khả năng có thể là kết nối mạng. Vị trí tốt hơn và khả năng kết nối ngang hàng được kỳ vọng sẽ dẫn đến chứng thực nhanh hơn. Một khả năng khác có thể là logic chứng thực được thực thể xác thực triển khai. Một số thực thể chứng thực nhanh chóng để đảm bảo chứng thực của họ đến đúng hạn. Những thực thể khác đợi cho đến khi họ quan sát các chứng thực khác để hiểu rõ hơn khối nào cần hỗ trợ để tăng khả năng chứng thực của họ là chuẩn. Cuối cùng, tương tự như những gì đã xảy ra với Kiln, một số thực thể có thể có cấu hình sai hoặc đang sử dụng các phiên bản máy khách không tối ưu.
Bên cạnh phân phối tổng thể, chúng tôi đã tính toán xác thực phần trăm thứ 95 trong mỗi mạng con. Nói cách khác, đây là thời gian cần thiết để 95% xác thực trong một mạng con nhất định đến được đích (tính từ khi khối được rơle công bố). Biểu đồ sau đây cho thấy phân phối của số liệu này cho từng khe và mạng con.
P95 trung bình là 3590ms, trong khi phần trăm thứ 95 của số liệu P95 là 4217ms, vẫn thấp hơn mức 4,5 giây cần thiết cho đề xuất khe 6 giây.
Để biết thêm các sơ đồ và phân tích, hãy tham khảo sổ tay 2.6-committee-attestations-with-relay-v2.ipynb .
Các yếu tố ảnh hưởng đến việc chứng thực muộn
Để hiểu rõ hơn các yếu tố dẫn đến việc đến muộn trong quá trình xác nhận, chúng tôi đã sử dụng cùng một mẫu ngẫu nhiên gồm 4963 khe thời gian tiếp sức. Chúng tôi dán nhãn mỗi lần xác nhận là muộn (nếu đến sau 4,5 giây) hoặc đúng giờ (nếu đến trước 4,5 giây). Ngưỡng 4,5 giây này sẽ là thời hạn tổng hợp trong khoảng thời gian 6 giây. Việc đến muộn chiếm 11,1% tổng số lần xác nhận. Để hỗ trợ việc huấn luyện mô hình, chúng tôi tiếp tục giảm mẫu của nhóm đa số (tức là đến đúng giờ) để đạt được tỷ lệ 50:50 trên biến này.
Sau đó, chúng tôi đã lắp hồi quy Logistic với Ước lượng Khả năng Cực đại (MLE) để dự đoán liệu một chứng thực bị trễ hay đúng hạn. Lớp dương mã hóa một chứng thực bị trễ. Đối với các đặc điểm, chúng tôi đã sử dụng mã hóa one-hot cho các thực thể của người kiểm tra và một số thông tin về khối, chẳng hạn như lượng gas đã sử dụng, số lượng blob và số lượng giao dịch. Việc sử dụng MLE không chỉ cho phép chúng tôi ước tính tác động của từng đặc điểm đến tỷ lệ logarit của các chứng thực bị trễ (thông qua các hệ số của mô hình tuyến tính), mà còn đánh giá ý nghĩa thống kê của những tác động đó (thông qua các giá trị p).
Hiệu suất tổng thể của mô hình được mô tả trong bảng tiếp theo.
Logit Regression Results==============================================================================Dep. Variable: y No. Observations: 117835 Model: Logit Df Residuals: 117812 Method: MLE Df Model: 22 Date: Wed, 27 Aug 2025 Pseudo R-squ.: 0.2402 Time: 17 : 59 : 49 Log-Likelihood: - 62058. converged: True LL-Null: - 81677. Covariance Type : nonrobust LLR p-value: 0.000
Hệ số Pseudo R bình phương cho thấy khả năng giải thích ở mức trung bình, trong khi giá trị p của Log-Likelihood và LLR cho thấy độ phù hợp của mô hình có ý nghĩa thống kê. Bây giờ, khi xem xét các đặc điểm có giá trị p thấp hơn 5% (xem bảng bên dưới), chúng tôi kết luận rằng mức tiêu thụ gas và số lượng blob có mối liên hệ thuận với việc đến muộn, trong khi số lượng giao dịch có mối liên hệ nghịch. Tác động tuy nhỏ nhưng rất có ý nghĩa do quy mô mẫu.
Biến | Hệ số. | giá trị p | Diễn giải |
---|---|---|---|
block_gas_used | +0,1305 | <0,001 | Sử dụng nhiều khí đốt hơn làm tăng nguy cơ đến muộn. |
số lượng khối | +0,0589 | <0,001 | Nhiều đốm hơn sẽ làm tăng khả năng đến muộn. |
block_tx_count | -0,0243 | 0,017 | Nhiều giao dịch hơn sẽ làm giảm đôi chút khả năng đến muộn. |
Tác động của lượng gas sử dụng và số lượng blob đúng như dự đoán - các khối sử dụng gas cao hơn có xu hướng mất nhiều thời gian hơn để thực thi, trong khi các khối có nhiều dữ liệu hơn mất nhiều thời gian hơn để lan truyền. Tuy nhiên, mối quan hệ nghịch đảo với số lượng giao dịch là điều không mong đợi. Cần lưu ý rằng mối tương quan giữa số lượng giao dịch và tỷ lệ đến muộn trong một khe khá yếu (0,015). Do đó, mối quan hệ quan sát được có thể là do tương tác với các tính năng khác.
Về các đặc điểm thực thể, chúng dường như không có ý nghĩa trong hồi quy logistic. Điều này có thể là do tính thưa thớt và các giả định cộng tuyến tính của mô hình. Hồi quy logistic có thể kết hợp các biến phân loại, nhưng chúng có thể gặp khó khăn khi các danh mục hiếm hoặc tương tác theo những cách phức tạp.
Để giải quyết vấn đề này, chúng tôi cũng đã huấn luyện một bộ mô hình dạng cây, phù hợp hơn để nắm bắt các đặc điểm phi tuyến tính như vậy. Bộ phân loại LightGBM đạt hiệu suất tốt nhất. Nó đạt điểm F1 là 0,762 và độ chính xác là 0,759 trên tập huấn luyện.
|
Trong mô hình này, các đặc điểm của thực thể cho thấy mức độ liên quan cao hơn nhiều, thể hiện qua cả thứ hạng tầm quan trọng của đặc điểm và giá trị Shapley được hiển thị tiếp theo. Để hỗ trợ việc diễn giải, các chấm đỏ ở bên phải biểu đồ đàn ong cho thấy một đặc điểm có tác động tích cực đến việc đến muộn. Ngược lại, các chấm xanh ở bên phải biểu đồ đàn ong cho thấy một đặc điểm có tác động tiêu cực đến việc đến muộn. Ví dụ: Stakewise đã xác định các chấm ở bên phải biểu đồ, cho thấy rằng các chứng thực từ thực thể này có nhiều khả năng đến muộn hơn là đến đúng hạn.
|
Những người đặt cược đơn lẻ dường như có tác động tiêu cực đến việc xác nhận muộn, tức là họ có xu hướng có ít xác nhận muộn hơn so với người xác thực trung bình. Bên cạnh các thực thể, số lượng blob và lượng khí được sử dụng vẫn tiếp tục cho thấy có liên quan, điều này hỗ trợ kết quả từ mô hình Hồi quy Logistic.
Đáng ngạc nhiên là thời gian đến khối phân vị thứ 66 không cho thấy mối quan hệ rõ ràng với việc đến muộn. Nó có tầm quan trọng đặc trưng cao nhất, nhưng các giá trị Shapley không cho thấy xu hướng rõ ràng. Xem biểu đồ phân tán sau, so sánh đặc trưng này với tỷ lệ đến muộn trong khe, chúng ta thấy rằng thời gian đến khối trong khoảng từ 1 giây đến 3,5 giây không ảnh hưởng đáng kể đến tỷ lệ xác nhận muộn trong một khe. Điều này cho thấy mặc dù đặc trưng này có liên quan, nhưng mối quan hệ của nó với các xác nhận muộn lại phức tạp và phi tuyến tính. Tác động của nó có thể thông qua tương tác với các đặc trưng khác, chẳng hạn như thực thể người xác nhận.
Để biết thêm thông tin về biểu đồ và phân tích, hãy tham khảo model_report . Mã để sao chép quá trình đào tạo và đánh giá mô hình là late_atts_model_runner.py
.