主要导航
首页
科技方案
AI智能工具
我的
登录
注册
AI模型评测
AI模型评测是对人工智能模型性能、准确性、效率及泛化能力的系统性评估,常通过基准测试、指标分析和实际场景验证,确保模型在不同任务中的可靠性和稳定性。
CLUE中文语言理解基准测评
项目简介 中文语言理解测评基准,包括代表性的数据集、基准(预训练)模型、语料库、排行...
LYi 林哥的大模型野榜
这两年各种号称能超越 OpenAI 的大模型层出不穷。为找出最好用的大模型,作者搭建了...
Open LLM Leaderboard
随着大量大型语言模型(LLMs)和聊天机器人每周都在发布,它们往往伴随着对性能的夸...
OpenCompass司南
OpenCompass(司南)是由上海人工智能实验室发布的开源大模型评测体系,目前已成为业...
FlagEval (天秤)大模型评测
平台简介 FlagEval (天秤)大模型评测体系及开放平台,旨在建立科学、公正、开放...
superbench 大模型评测榜单
SuperBench是什么 SuperBench 是由清华大学基础模型研究中心联合中关村实验室在 2...
Livebench LLM模型的基准测试平台
LiveBench 的介绍: 1. 核心目标与设计理念 LiveBench 的设计初衷是解...
CLiB中文大模型能力评测榜单
目前已囊括195个大模型,覆盖chatgpt、gpt-4o、o3-mini、谷歌gemini、Claude3.5、智谱...
Artificial Analysis AI基准测试平台
Artificial Analysis平台是一家领先的独立AI基准测试和分析平台,上面分析的模型不...
lmarena.ai
lmarena.ai是一个由加州大学伯克利分校 SkyLab 和 LMSYS 的研究人员...
SuperCLUE
SuperCLUE是什么 SuperCLUE是一个专注于中文大模型综合测评的权威平台,其产...
首页
上一页
下一页
尾页
1/1
首页
分类
工具
文章
我的