
SuperCLUE 是一個中文通用大模型綜合性評測基準(zhǔn),從三個不同的維度評價模型的能力:基礎(chǔ)能力、專業(yè)能力和中文特性能力。
其中基礎(chǔ)能力能力包括:?語義理解、對話、邏輯推理、角色模擬、代碼、生成與創(chuàng)作等10項(xiàng)能力。
專業(yè)能力包括: 包括了中學(xué)、大學(xué)與專業(yè)考試,涵蓋了從數(shù)學(xué)、物理、地理到社會科學(xué)等50多項(xiàng)能力。
中文特性能力: 針對有中文特點(diǎn)的任務(wù),包括了中文成語、詩歌、文學(xué)、字形等10項(xiàng)多種能力。