opencompass

OpenCompass 是一个开源的大模型评测框架,提供全面、透明的评估体系,支持多种任务和数据集,用于衡量大语言模型在不同场景下的性能表现,助力模型优化与迭代。