CMMLU

CMMLU

专门用于评估语言模型在中文语境下的知识和推理能力

标签：AI模型测评

链接直达手机查看

专门用于评估语言模型在中文语境下的知识和推理能力

相关导航

HELM

斯坦福大学推出的大模型测评体系

Open LLM Leaderboard

Open LLM Leaderboard

Hugging Face推出的开源大模型排行榜单

LLMEval3

复旦大学NLP实验室推出的大模型评测基准

PubMedQA

生物医学研究问答数据集和模型得分排行榜

SuperCLUE

中文通用大模型综合性评测基准

OpenCompass

OpenCompass

上海人工智能实验室推出的大模型开放评测体系

暂无评论

暂无评论...

AIGC315 测评导航站，集AI导航网址、AI工具测评、资源、资讯，欢迎您的体验

友链申请免责声明广告合作关于我们

Copyright © 2024 AIGC315