无需额外训练提升模型30%性能！DeepMind科学家点赞MIT博士生成果

AI行业动态7个月前发布 ainavi

5,880 0 3600

一个来自MIT博士生的惊人发现：只需对Transformer的特定层进行一种非常简单的修剪，即可在缩小模型规模的同时显著提高模型性能。无需额外训练提升模型30%性能！DeepMind科学家点赞MIT博士生成果
效果主要体现在文本理解任务上，最高可达30%。这在3个模型（LLama2、GPT-J和Roberta）和8个不同数据集上都得到了验证（包含认知推理、世界知识等）。除了文本理解，它也适用于强化学习。这个操作只需在模型训练完成之后进行，不需要额外的参数和数据。

# AI行业动态

© 版权声明

文章版权归作者所有，未经允许请勿转载。

关注公众号，免费获取chatgpt账号

免费获取chatgpt

相关文章

马斯克Grok出现幻觉自称是OpenAI产品

ainavi

5,068 400

华为发布旗舰平板、全新高端手机品牌，鸿蒙原生应用全面启动

ainavi

7,828 800

上海AI实验室开源医疗大模型群“浦医2.0”

ainavi

7,316 3600

大模型总弄错「事实」怎么办？这有一份汇聚了300多篇文献的综述

ainavi

6,536 3200

Nature | 一场人工智能革命正在医学领域酝酿，它会是什么样子？

ainavi

5,576 3600

大模型能自己优化Prompt了，曾经那么火的提示工程要死了吗？

ainavi

3,600 1600

暂无评论

暂无评论...

AI中国(aicn.me)致力于收集与AI相关的热门工具，包括但不限于ChatGPT、AI视频、AI办公、AI语音等领域，并为广大AI爱好者提供学习平台，降低获取学习资源的成本。同时，同步分享最新的行业前沿AI工具和网站，旨在帮助AI爱好者不断探索AI技术的发展。

关于我们 AI教程

Copyright © 2024 优智创想智能工具导航粤ICP备2023063465号