浙大校友开源多模态大模型LLaVA-1.5

AI行业动态10个月前发布 ainavi

7,660 0 2800

来自威斯康星大学麦迪逊分校、微软研究院以及哥伦比亚大学的研究人员开源发布了端到端多模态大模型LLaVA-1.5。据介绍，该模型不仅在11个基准测试上实现了SOTA，甚至还可以直接对打GPT-4V。
此前，该团队于今年4月发布了LLaVA大模型。此次升级，研究人员通过使用带有MLP映射的CLIP-ViT-L-336px，添加具有简单响应格式提示的、面向学术任务的VQA数据，大幅提升了LLaVA-1.5的性能。实验结果显示，架构更加简单的LLaVA-1.5只需要120万公开数据，即可超越用了14.5亿训练数据的Qwen-VL和1.3亿数据的HuggingFace IDEFICS。其中，13B模型的训练只需要8个A100芯片就可以在1天内完成。

# AI行业动态

© 版权声明

文章版权归作者所有，未经允许请勿转载。

关注公众号，免费获取chatgpt账号

免费获取chatgpt

相关文章

未来大模型顶会？陈丹琦等人组织首届COLM，为语言建模研究提供新平台

ainavi

6,720 2400

DeepMind联创：建议限供芯片来确保AI安全

ainavi

9,480 3200

「天工2.0」MoE大模型发布——「天工AI」国内首个MoE架构免费向C端用户开放的大语言模型应用全新问世

ainavi

6,708 2400

中国将成AI领域领头羊！谷歌CEO：中美应合作监管创新

ainavi

8,116 2000

OpenAI发布新功能：现在可以给ChatGPT定制人格角色啦！

ainavi

6,068 400

4G显存低配畅玩AIGC！ControlNet作者新作：小白也能画大片

ainavi

7,596 2400

暂无评论

暂无评论...

AI中国(aicn.me)致力于收集与AI相关的热门工具，包括但不限于ChatGPT、AI视频、AI办公、AI语音等领域，并为广大AI爱好者提供学习平台，降低获取学习资源的成本。同时，同步分享最新的行业前沿AI工具和网站，旨在帮助AI爱好者不断探索AI技术的发展。

关于我们 AI教程

Copyright © 2024 优智创想智能工具导航粤ICP备2023063465号