无需额外训练提升模型30%性能！DeepMind科学家点赞MIT博士生成果

AI行业动态7个月前发布 ainavi

10,040 0 2000

一个来自MIT博士生的惊人发现：只需对Transformer的特定层进行一种非常简单的修剪，即可在缩小模型规模的同时显著提高模型性能。无需额外训练提升模型30%性能！DeepMind科学家点赞MIT博士生成果
效果主要体现在文本理解任务上，最高可达30%。这在3个模型（LLama2、GPT-J和Roberta）和8个不同数据集上都得到了验证（包含认知推理、世界知识等）。除了文本理解，它也适用于强化学习。这个操作只需在模型训练完成之后进行，不需要额外的参数和数据。

# AI行业动态

© 版权声明

文章版权归作者所有，未经允许请勿转载。

关注公众号，免费获取chatgpt账号

免费获取chatgpt

相关文章

智加科技亮相中国电动汽车百人会论坛，以创新技术构建商用车新质生产力

ainavi

3,852 2800

知乎周源：我们拥抱AI，社区仍将以人为先

ainavi

6,888 2800

马斯克Grok出现幻觉自称是OpenAI产品

ainavi

5,068 400

AI视频生成卷出新高度：高清电影画质免费无限玩，号称“史上最强”

ainavi

5,124 2400

清华、浙大、复旦校友在列，2024苹果博士奖学金华人占一半

ainavi

8,564 3600

GPT、Llama等大模型存在「逆转诅咒」，这个bug该如何缓解？

ainavi

4,860 2400

暂无评论

暂无评论...

AI中国(aicn.me)致力于收集与AI相关的热门工具，包括但不限于ChatGPT、AI视频、AI办公、AI语音等领域，并为广大AI爱好者提供学习平台，降低获取学习资源的成本。同时，同步分享最新的行业前沿AI工具和网站，旨在帮助AI爱好者不断探索AI技术的发展。

关于我们 AI教程

Copyright © 2024 优智创想智能工具导航粤ICP备2023063465号