LiveBench

LiveBench 是一个用于评估大语言模型性能的动态基准测试平台,涵盖多种任务类型,支持持续更新和实时评测,旨在全面衡量模型在真实场景中的表现能力。