Vấn đề về quy mô dữ liệu tiền điện tử

Bài viết này được dịch máy
Xem bản gốc

Bây giờ là năm 2024 và bạn nghĩ rằng việc lấy dữ liệu tiền điện tử thật dễ dàng vì bạn có Etherscan, Dune và Nansen cho phép bạn xem dữ liệu bạn muốn mọi lúc. Vâng, đại loại thế.

Tỉ lệ

Bạn thấy đấy, ở vùng đất web2 bình thường, khi bạn có một công ty với 10 nhân viên và 100.000 khách hàng, lượng dữ liệu bạn đang tạo ra có thể không quá 100 giga byte (ở phía trên). Quy mô dữ liệu đó đủ nhỏ, iPhone của bạn có thể xử lý bất kỳ câu hỏi nào bạn có và lưu trữ mọi thứ. Tuy nhiên, khi bạn có 1.000 nhân viên và 100.000.000 khách hàng, lượng dữ liệu bạn có thể đang xử lý hiện ở mức hàng trăm terabyte, nếu không muốn nói là petabyte.

Về cơ bản, đây là một thách thức hoàn toàn khác vì quy mô mà bạn đang xử lý đòi hỏi phải cân nhắc nhiều hơn. Để xử lý hàng trăm terabyte dữ liệu, bạn cần một cụm máy tính phân tán để gửi công việc tới. Khi gửi những công việc này, bạn phải suy nghĩ về:

Đây là tất cả những điều bạn cần cân nhắc khi xử lý dữ liệu lớn trên nhiều máy. Quy mô gây ra các vấn đề mà những người không làm việc với nó không thể nhìn thấy được. Dữ liệu là một trong những miền mà bạn càng mở rộng quy mô thì bạn càng cần nhiều cơ sở hạ tầng để quản lý dữ liệu một cách chính xác. Những vấn đề vô hình đối với hầu hết mọi người. Để xử lý quy mô này, bạn cũng có thêm những thách thức:

Thật buồn cười, trong web2 mọi người đều muốn dữ liệu được công khai. Cuối cùng thì trong web3 cũng vậy nhưng rất ít người biết cách thực hiện những công việc cần thiết để hiểu được nó. Một sự thật sai lầm về điều này là với một số trợ giúp, bạn có thể lấy tập dữ liệu của mình từ tập dữ liệu chung một cách dễ dàng, điều đó có nghĩa là dữ liệu “cục bộ” thì dễ dàng, tuy nhiên dữ liệu “toàn cầu” thì khó lấy (những thứ liên quan đến mọi người). và mọi thứ).

Sự phân mảnh

Như thể mọi thứ chưa phải là thách thức với quy mô mà bạn phải làm việc. Có một khía cạnh mới khiến dữ liệu tiền điện tử trở nên thách thức và đó là thực tế là bạn liên tục bị phân mảnh do các khuyến khích tài chính của thị trường. Ví dụ:

Việc phân mảnh có thể đặc biệt khó khăn do bạn không thể định lượng được những gì bạn không biết. Bạn sẽ không bao giờ biết tất cả các L2 tồn tại trên thế giới và tổng số máy ảo sẽ xuất hiện. Bạn sẽ có thể theo kịp khi họ đạt đủ quy mô nhưng đó là câu chuyện vào lúc khác.

Mở nhưng không tương tác được

Điều cuối cùng mà tôi nghĩ khiến nhiều người ngạc nhiên và thực tế là dữ liệu có thể mở, nhưng không, nó không thể tương tác dễ dàng. Bạn thấy đấy, tất cả các hợp đồng thông minh được ghép lại với nhau giống như một cơ sở dữ liệu nhỏ bên trong cơ sở dữ liệu lớn hơn. Tôi thích coi chúng như những lược đồ. Tất cả dữ liệu đều ở đó, nhưng cách bạn ghép chúng lại với nhau thường được nhóm phát triển hợp đồng thông minh hiểu rõ. Bạn có thể dành thời gian để tự mình hiểu nó nếu muốn nhưng bạn sẽ phải làm điều đó hàng trăm lần cho tất cả các lược đồ tiềm năng - và làm thế nào bạn thậm chí có đủ khả năng để làm điều đó mà không phải tiêu tốn một khoản tiền lớn mà không có một người mua ở phía bên kia của giao dịch?

Trong trường hợp điều này có vẻ quá trừu tượng, hãy để tôi đưa ra một ví dụ. Bạn nói “Người dùng này sử dụng cầu bao nhiêu?”. Mặc dù đó là một câu hỏi nhưng nó có nhiều vấn đề lồng ghép trong đó. Hãy chia nhỏ nó ra:

Mỗi thách thức trên đều rất khó giải quyết và đòi hỏi nhiều nguồn lực.

Kết quả

Vậy tất cả điều này dẫn tới điều gì? Vâng, tình trạng của hệ sinh thái chúng ta có ngày nay là…

Tôi hy vọng bài viết này đã giúp bạn mở rộng tầm mắt về thực tế của bối cảnh dữ liệu trong tiền điện tử. Nếu bạn đang gặp phải bất kỳ vấn đề nào trong số này hoặc muốn tìm hiểu cách khắc phục chúng, hãy liên hệ - tôi và nhóm của tôi đang giải quyết những vấn đề này.

Khu vực:
Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
6
Thêm vào Yêu thích
1
Bình luận