??很高興通知大家??: 會(huì)員三群福利前100名額??: 已發(fā)布在 會(huì)員群 看到速度

FlagEval(天秤)由智源研究院將聯(lián)合多個(gè)高校團(tuán)隊(duì)打造,是一種采用“能力—任務(wù)—指標(biāo)”三維評(píng)測(cè)框架的大模型評(píng)測(cè)平臺(tái),旨在提供全面、細(xì)致的評(píng)測(cè)結(jié)果。該平臺(tái)已提供了 30 多種能力、5 種任務(wù)和 4 大類指標(biāo),共 600 多個(gè)維度的全面評(píng)測(cè),任務(wù)維度包括 22 個(gè)主客觀評(píng)測(cè)數(shù)據(jù)集和 84433 道題目。