Google DeepMind vừa ra mắt AlphaEarth Foundations mới, một ra mắt"góc nhìn của Chúa". Với độ phân giải 10 mét, dự án này tạo ra bức chân dung kỹ thuật số chưa từng có về Trái Đất. Cư dân mạng đang thốt lên: "Đây chẳng phải là 'ChatGPT cho Trái Đất' sao?"
Ngay bây giờ, gia đình Alpha có sản phẩm mới!
Lần này, Google DeepMind đã giúp con người mở ra "góc nhìn của Chúa" - AlphaEarth Foundations mới đang lập bản đồ toàn bộ trái đất với độ chi tiết đáng kinh ngạc.
Nó tích hợp dữ liệu quan sát Trái Đất ở cấp độ petabyte để tạo ra biểu diễn dữ liệu thống nhất.
Cụ thể, AlphaEarth Foundations cô đọng thông tin của mọi lưới 10x10 mét trên trái đất thành dữ liệu hiệu quả, với tổng cộng 64 chiều.
Độ phân giải 10 mét đủ để bạn nhìn rõ mọi ngóc ngách của trái đất.
Google cô đọng bản chất của dữ liệu vệ tinh từ nhiều nguồn trong một năm vào mỗi pixel vuông có diện tích 10 mét vuông.
Điểm độc đáo của AlphaEarth Foundations nằm ở khả năng "học tính năng" mạnh mẽ.
Thông qua công nghệ nhúng phức hợp, mô hình có thể rút các đặc điểm chính từ dữ liệu quang học, radar và 3D, dễ dàng phân biệt giữa bãi biển và sa mạc, rừng và đất nông nghiệp.
Khả năng này cho phép nó vượt qua các phương pháp AI và phương pháp truyền thống khác, giảm tỷ lệ lỗi xuống 24%.
Cùng ngày, đội ngũ Google cũng đã công bố báo cáo kỹ thuật toàn diện dài 63 trang.
Địa chỉ bài viết: https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail/alphaearth-foundations.pdf
AlphaEarth Foundations giống như một "vệ tinh ảo", cung cấp cho con người một cửa sổ để quan sát nhịp đập của Trái Đất.
Nó cho phép các nhà khoa học phân tích động lực của Trái đất nhanh hơn và hiệu quả hơn, theo dõi sức khỏe mùa màng, theo dõi nạn phá rừng và giải quyết các vấn đề tính toàn cầu như biến đổi khí hậu.
Một cư dân mạng đã khen ngợi Google vì đã thực hiện bước tiến quan trọng hướng tới việc xây dựng "phiên bản Trái Đất của ChatGPT".
Câu hỏi đặt ra là tại sao chúng ta lại cần phiên bản AI của mô hình trái đất?
Phiên bản AI của "vệ tinh ảo" ra mắt, độ chính xác cực cao 64 chiều
Mỗi ngày, vệ tinh ghi lại mọi thay đổi của Trái Đất từ không gian, tạo ra khối lượng lớn hình ảnh và dữ liệu quan sát.
Dữ liệu này cung cấp cho các nhà khoa học và người ra quyết định cái nhìn toàn cảnh gần như theo thời gian thực về Trái Đất.
Trong 15 năm qua, nền tảng Earth Engine đã mở ra những hình ảnh quan sát Trái Đất và dữ liệu không gian địa lý, giúp thay đổi hoàn toàn cách chúng ta hiểu về Trái Đất.
Tuy nhiên, tính phức tạp, đa phương thức và tốc độ làm mới của nó cũng đặt ra một thách thức mới: làm thế nào để kết nối các tập dữ liệu không đồng nhất và sử dụng chúng một cách hiệu quả?
Sự ra đời của AlphaEarth Foundations đã trở thành vũ khí đắc lực để giải quyết vấn đề này.
Đây là mô hình AI được gọi là "vệ tinh ảo" có thể tích hợp khối lượng lớn dữ liệu quan sát hình cầu thành một biểu diễn kỹ thuật số thống nhất (tức là "nhúng") có thể dễ dàng được xử lý bởi hệ thống máy tính.
Cuối cùng, nó đã lập bản đồ toàn bộ đất liền và vùng nước ven biển của Trái Đất với độ chi tiết chưa từng có.
AlphaEarth Foundations không chỉ cung cấp cho các nhà khoa học bức tranh toàn diện và nhất quán hơn về quá trình tiến hóa của Trái đất mà còn giúp họ đưa ra quyết định sáng suốt hơn trong các lĩnh vực như an ninh lương thực, nạn phá rừng, mở rộng đô thị và quản lý tài nguyên nước.
Nó hoạt động như thế nào
Bằng cách giải quyết hai thách thức chính là "quá tải dữ liệu" và "thông tin không nhất quán", AlphaEarth Foundations cung cấp cho chúng ta góc nhìn mới về việc hiểu Trái Đất.
Đầu tiên, nó tích hợp một lượng lớn thông tin từ hàng chục nguồn công khai khác nhau, bao gồm hình ảnh vệ tinh quang học, radar, lập bản đồ laser 3D, mô phỏng khí hậu, v.v.
Công nghệ này tích hợp tất cả thông tin này và sau đó phân tích đất liền và vùng nước ven biển toàn cầu với độ chính xác cực cao ở kích thước rõ nét 10x10 mét, theo dõi những thay đổi của Trái Đất theo thời gian.
Thứ hai, nó giúp dữ liệu này dễ truy cập hơn.
Cải tiến quan trọng của hệ thống là khả năng tạo ra bản tóm tắt số cực kỳ nhỏ gọn cho từng diện tích hình vuông.
Những bản tóm tắt này sử dụng ít không gian lưu trữ hơn 16 lần so với các hệ thống AI khác, giúp giảm đáng kể chi phí phân tích ở quy mô hành tinh.
Bước đột phá này cho phép các nhà khoa học làm được điều trước đây không thể: tạo ra bản đồ thế giới chi tiết và nhất quán theo yêu cầu.
AlphaEarth Foundations hoạt động rút các khung hình được lấy mẫu không đồng đều từ một chuỗi video để lập chỉ mục vị trí tại bất kỳ thời điểm nào. Điều này giúp mô hình xây dựng một góc nhìn liên tục về địa điểm trong khi diễn giải lượng lớn dữ liệu đo lường.
Cho dù họ đang theo dõi sức khỏe mùa màng, theo dõi nạn phá rừng hay quan sát công trình xây dựng mới, họ không còn cần phải chỉ dựa vào vệ tinh bay trên cao nữa.
Bây giờ họ có một loại "nền tảng dữ liệu không gian địa lý" mới.
AlphaEarth Foundations cũng đã chứng minh được độ chính xác vô song sau quá trình thử nghiệm nghiêm ngặt.
Theo thời gian, nó thực hiện xuất sắc nhiều nhiệm vụ khác nhau, bao gồm xác định mục đích sử dụng đất và ước tính các đặc tính bề mặt.
Điều quan trọng là ngay cả khi dữ liệu đánh dấu khan hiếm, tỷ lệ lỗi của nó vẫn thấp hơn trung bình 24% so với các mô hình khác, chứng tỏ hiệu quả học tập đáng chú ý.
Trường nhúng toàn cục được phân tách thành các nhúng riêng lẻ (từ trái sang phải). Mỗi nhúng chứa 64 thành phần ánh xạ tới các điểm tọa độ trên mặt cầu 64 chiều.
Trong dữ liệu bản đồ được tạo bên dưới, AlphaEarth Foundations nhúng 64 chiều, gán ba màu tương ứng là đỏ, xanh lá cây và xanh lam để trực quan hóa các chi tiết phong phú về thế giới của chúng ta.
Ở Ecuador, mô hình này có thể xuyên qua lớp mây dày đặc để cung cấp hình ảnh chi tiết về đất nông nghiệp ở nhiều giai đoạn phát triển khác nhau.
Ở những nơi khác, nó lập bản đồ rõ ràng về bề mặt phức tạp của Nam Cực – một khu vực nổi tiếng là khó chụp ảnh do hình ảnh vệ tinh không ổn định.
Hơn nữa, nó còn tiết lộ những khác biệt trong việc sử dụng đất nông nghiệp của Canada mà mắt thường không thể nhìn thấy được.
Tiếp theo, chúng tôi sẽ phân tích chi tiết sức mạnh của dữ liệu do AlphaEarth Foundations tạo ra.
10x10 pixel, cô đọng dữ liệu của một năm
Đội ngũ Google đã sử dụng AlphaEarth Foundations để tạo ra một dữ liệu nhúng được tính toán trước toàn cầu với độ phân giải 10 mét mỗi năm, bao gồm từ năm 2017 đến nay.
Những hình ảnh "nhúng" này có thể trông giống như những bộ sưu tập hình ảnh Earth Engine thông thường, nhưng chúng tích hợp khả năng rút tính năng hỗ trợ bởi AI vào từng pixel.
Thông tin nào được chứa trong vectơ "nhúng"?
Dữ liệu đo lường đa nguồn
Các vectơ nhúng được học từ nhiều nguồn dữ liệu để nắm bắt thông tin ngữ nghĩa của các thuộc tính bề mặt.
Ví dụ, việc nhúng một điểm ảnh không chỉ phản ánh các đặc điểm quang phổ của nó mà còn bao gồm hoàn cảnh xung quanh, những thay đổi theo mùa (như hiện tượng thực vật, lớp tuyết phủ) cũng như các đặc điểm địa hình và khí hậu.
· Bối cảnh không gian-thời gian
AlphaEarth Foundations đã được đào tạo trên hơn 3 tỷ khung hình ảnh độc lập được lấy mẫu từ hơn 5 triệu địa điểm trên toàn thế giới.
Mô hình này xử lý hình ảnh vệ tinh của một địa điểm theo thời gian như các khung hình liên tiếp trong video.
Điều này cho phép học tập trên không gian, thời gian và chế độ đo lường, tạo ra các nhúng nắm bắt bối cảnh không gian trong khi vẫn bảo toàn quỹ đạo thời gian.
Điều này có nghĩa là mỗi vectơ nhúng trong Dữ liệu nhúng vệ tinh cung cấp một biểu diễn cực kỳ nhỏ gọn và giàu ngữ nghĩa về điều kiện của mỗi pixel 10 mét (100 mét vuông) trên bề mặt đất liền của Trái Đất.
Việc nhúng mỗi điểm ảnh 10 mét cũng thu thập thông tin về khu vực xung quanh nó.
Do đó, ngay cả khi một số khu vực (chẳng hạn như bề mặt nhựa đường của bãi đậu xe và đường cao tốc) rất giống nhau khi xem xét riêng lẻ, các vectơ nhúng của chúng vẫn có thể rất khác nhau.
· Xem Trái Đất trong 64 chiều: Tọa độ và Dải
Hình ảnh vệ tinh được nhúng trong dữ liệu có 64 băng tần – nhưng chúng không giống với độ phản xạ quang học cổ điển hoặc phản hồi radar.
Ngược lại, 64 "dải" của một pixel duy nhất trong phần nhúng AlphaEarth Foundations biểu thị tọa độ 64 chiều trên một "hình cầu" 64 chiều.
Các tọa độ này được tạo ra bởi DL và có thể diễn giải được về mặt toán học, nhưng chúng không phải là phép đo vật lý trực tiếp. Thay vào đó, chúng là một biểu diễn cô đọng của không gian đo lường đa chiều.
"Nhúng vệ tinh" về cơ bản là một điểm tọa độ trên bề mặt của một "hình cầu" 64 chiều
Với dữ liệu nhúng vệ tinh, các nhà khoa học có thể thực hiện "tìm kiếm điểm tương đồng".
Chỉ cần chọn một điểm ảnh mục tiêu và vectơ nhúng có thể nhanh chóng xác định vị trí các khu vực có bề mặt và điều kiện hoàn cảnh tương tự trên quy mô toàn cầu thông qua phép tính tích vô hướng đơn giản.
Vectơ nhúng cho trung tâm thành phố New York dễ dàng khớp với các khu vực đô thị hóa cao khác.
Tìm kiếm sự tương đồng cho tọa độ 73.9812, 40.7628 (Midtown Manhattan, Thành phố New York, Hoa Kỳ)
Hơn nữa, so sánh dựa trên sự tương đồng cũng có thể áp dụng cho chiều thời gian và có thể được sử dụng để phát hiện thay đổi do nhúng và theo dõi tính ổn định.
Không gian nhúng của AlphaEarth Foundations được thiết kế để duy trì tính nhất quán theo thời gian.
Bằng cách so sánh các vectơ nhúng của cùng một pixel trong những năm khác nhau, có thể dễ dàng theo dõi sự mở rộng đô thị, phục hồi sau cháy rừng, thay đổi mực nước hồ chứa, v.v.
Hình sau đây cho thấy một số thay đổi được quan sát thấy trong không gian nhúng giữa năm 2020 và 2024. Hình cuối cùng trong mỗi hàng cho thấy mức độ tương đồng của từng pixel với chính nó (giá trị sáng hơn cho thấy sự khác biệt lớn hơn), tương ứng với các loại thay đổi sau:
Sự phát triển tràn lan của vùng ngoại ô
Vùng đất sau vụ cháy rừng, xen kẽ trong đó những khu vực đã bị phá rừng trước vụ cháy
Những thay đổi trong hồ chứa nhân tạo từ thời kỳ hạn hán sang thời kỳ cứu trợ nước
Sự thay đổi trong đất nông nghiệp giữa các năm, chứng minh cách nhúng có thể nắm bắt được động lực trong năm như chu kỳ cây trồng và đất bỏ hoang
Hơn nữa, các vectơ nhúng, kết hợp với thuật toán ee.Clusterer của Earth Engine, sẽ tự động nhóm các pixel thành các loại bề mặt đất khác nhau (ví dụ: rừng, đất, khu vực đô thị) mà không cần dán nhãn trước.
Điều này có thể tiết lộ các mô hình địa mạo ẩn giấu và hỗ trợ nghiên cứu các đặc điểm địa hình, thủy văn và hiện tượng học.
ChatGPT cho Trái Đất, tạo bản đồ theo yêu cầu
Hiện tại, dữ liệu Satellite Embedding do AlphaEarth Foundations điều hành là một trong dữ liệu lớn nhất trong Earth Engine.
Mỗi năm, nó chứa hơn 1,4 nghìn tỷ dấu chân "được nhúng".
Nhiều tổ chức trên khắp thế giới, bao gồm Tổ chức Lương thực và Nông nghiệp Liên hợp quốc, Harvard Forest, Nhóm quan sát Trái đất, MapBiomas, Đại học bang Oregon và nhiều tổ chức khác, đã sử dụng dữ liệu này để tạo bản đồ tùy chỉnh và thu thập thông tin chi tiết về thế giới thực.
Trong ứng dụng thực tế, AlphaEarth Foundations đã đạt được những kết quả ban đầu.
Dự án Global Ecosystems Atlas sử dụng dữ liệu để phân loại các hệ sinh thái chưa được lập bản đồ thành các loại như bụi rậm biển và sa mạc cực khô cằn.
Nguồn tài nguyên đầu tiên này cung cấp hỗ trợ quan trọng cho các quốc gia trong việc ưu tiên các khu bảo tồn, thúc đẩy phục hồi sinh thái và hạn chế mất đa dạng sinh học.
Ngoài ra còn có dự án "MapBiomas" của Brazil, thông qua việc thử nghiệm dữ liệu này, dự án đã hiểu sâu hơn về những thay đổi về nông nghiệp và hoàn cảnh, cung cấp thông tin cho các chiến lược bảo tồn và các sáng kiến phát triển bền vững trong các hệ sinh thái quan trọng như rừng mưa Amazon.
AlphaEarth Foundations đại diện cho bước tiến quan trọng trong quá trình hiểu biết của nhân loại về động lực học của Trái Đất.
Tiếp theo, đội ngũ Google sẽ sử dụng nó để tạo ra các nhúng hàng năm và kết hợp nó với Gemini mạnh mẽ để tối đa hóa hiệu quả của nó.
Là một phần của Google Earth AI, họ cũng sẽ tiếp tục khám phá những cách tốt nhất để áp dụng khả năng chuỗi thời gian của mô hình.
Tham khảo:
https://x.com/bilawalsidhu/status/1950580970907648234
https://deepmind.google/discover/blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail/
https://medium.com/google-earth/ai-powered-pixels-introducing-googles-satellite-embedding-dataset-31744c1f4650
Bài viết này được trích từ tài khoản công khai WeChat "Xinzhiyuan" , tác giả: Xinzhiyuan và được 36Kr cho phép xuất bản.



