在一次聯(lián)合基準測試中,顯卡現(xiàn)AntChain OpenLabs 與 ZEROBASE揭示了一個長期被忽視的加速硬件架構(gòu)瓶頸:GPU 在加速零知識證明(ZKP)方面存在根本性限制,尤其是并非在當前廣泛使用的 Groth16證明系統(tǒng)中。
雖然 GPU 在 MSM(多標量乘法)與 NTT(數(shù)論變換)階段可實現(xiàn) 百倍以上的終極加速性能提升,但在最終關鍵階段 r1cs.Solve 中,答案的聯(lián)由于該步驟無法并行,顯卡現(xiàn)必須串行執(zhí)行,加速GPU 的并非優(yōu)勢幾乎完全失效。
這一發(fā)現(xiàn)擊碎了 ZK 工程界一個流行假設:GPU 核心越多 ≠ 證明速度越快。終極
為什么這件事重要?答案的聯(lián)
當前大多數(shù) ZK 電路(包括 zkSNARK 類應用)仍然依賴 Groth16 作為底層證明系統(tǒng)。盡管 GPU 在預處理環(huán)節(jié)效果顯著,顯卡現(xiàn)但在電路約束求解(r1cs.Solve)階段,加速GPU 加速幾乎無效,并非甚至被高頻多核 CPU 輕松碾壓。終極
我們在實際電路測試中發(fā)現(xiàn):
MSM / NTT 階段 → GPU 表現(xiàn)極其優(yōu)秀r1cs.Solve 階段 → CPU 在真實場景中性能大幅優(yōu)于 GPU
這意味著:即使 GPU 架構(gòu)繼續(xù)擴展,答案的聯(lián)ZKP 的瓶頸依然出現(xiàn)在最后的“拼圖”階段。
ZK 加速范式正在轉(zhuǎn)變
與其繼續(xù)在 GPU 上堆砌算力,不如正視問題本質(zhì),邁向下一代 ZK 加速模型:
面向并行的算法設計更合理的電路結(jié)構(gòu)劃分多核 CPU 優(yōu)化的執(zhí)行架構(gòu)尊重串行步驟特性的混合加速框架
這不僅僅是硬件側(cè)的調(diào)整,更影響整個 ZK 體系結(jié)構(gòu)的未來,包括 DSL 電路語言、證明器架構(gòu)、調(diào)度引擎等核心環(huán)節(jié)。
ZEROBASE 的立場
作為專注于可驗證計算基礎設施的加密證明網(wǎng)絡,ZEROBASE 致力于:
揭示隱藏在硬件加速背后的真相推動 zkProver 下一代架構(gòu)標準建設深度研發(fā)基于 CPU 優(yōu)化路徑的可擴展 ZK 模型
我們堅信:基準測試公開透明 + 跨機構(gòu)協(xié)作,才是構(gòu)建高性能、可落地、可商用的 ZK 基礎設施的關鍵。