“Bằng cách tích hợp mô hình vào chip silicon, Taalas mở khóa những bước nhảy vọt về hiệu năng được đo bằng bậc độ lớn — chứ không phải phần trăm — bao gồm khả năng xử lý 17.000 token mỗi giây cho mỗi người dùng, với chi phí và điện năng chỉ bằng 1/20 so với các GPU hiện nay.”