Dolly是一款具有低成本训练能力的语言模型,表现出了惊人的指令执行能力,与ChatGPT相当。模型团队发现,即使是使用具有更早架构的多年开源老模型,在对少量指令训练数据进行微调时,也会表现出令人惊喜的表现。

Dolly从EleutherAI中提取了一个现有的开源60亿参数模型,并对其进行轻微修改,即获得了原始模型中没有的指令执行能力。尽管Dolly的基础模型只有60亿个参数,相对于GPT-3的参数1750亿,而且已经有两年的历史了,但其工作效果同样出色,这表明最先进模型的大部分优势源于对训练数据的专注和精细。

Dolly的发布,为那些希望以低成本构建自己的大型模型的公司提供了可能。这一创新将为语言模型领域产生革命性的影响,让更多的公司和组织能够利用深度学习技术,开发出更具实用和生产力的应用程序。

评论交流2

登录后可发布评论哦~
    avatar
    军哥
    2026-05-15

    体验了Dolly,感觉挺有惊喜的。作为低成本微调的小模型,它的指令执行力还算不错。虽在复杂任务上或许略显稚嫩,但对于日常简单需求来说,已经是个蛮贴心的小工具了,能感受到开发者的用心,值得鼓励。

    avatar
    刘先生
    2026-05-15

    体验了一下Dolly.AI,这款“小而美”的轻量模型确实让人惊喜。虽然它参数不大,但在理解指令时表现得相当乖巧听话。面对日常简单的问答,回应也算得体。低成本就能有这样不错的效果感觉是个挺贴心的小帮手。