複製鏈接
請複製以下鏈接發送給好友

每秒查詢率

鎖定
每秒查詢率(QPS,Queries-per-second),即單位時間單位計算資源處理的(生成推理結果的)請求數據量。在大模型場景下,QPS的提升意味着模型推理速度的提高,這能夠為更多用户提供服務或降低模型推理的成本。 [2] 
中文名
每秒查詢率
外文名
Queries-per-second
術語簡介
每秒查詢率(QPS,Queries-per-second)是對一個特定的查詢服務器在規定時間內所處理流量多少的衡量標準,在因特網上,作為域名系統服務器的機器的性能經常用每秒查詢率來衡量。 [1] 
參考資料