研究称Gemini Pro视觉能力与GPT-4V不相上下

AI行业动态7个月前发布 ainavi

5,104 0 1200

来自腾讯优图实验室、上海AI实验室、香港中文大学多媒体实验室等机构的团队发表128页的论文，对谷歌Gemini Pro的视觉理解能力进行测评并与OpenAI的GPT-4V比较，同时还与最新的开源MLLM Sphinx进行了比较，Sphinx显示了人工和黑盒系统之间的差距。测评涵盖了四个领域：基础感知、高级认知、挑战性视觉任务和各种专业能力。定性样本表明，虽然GPT-4V和Gemini展示了不同的回答风格和偏好，但它们在视觉推理能力上是可比较的，而Sphinx在领域泛化方面仍然落后于它们。具体来说，GPT-4V倾向于详细解释和中间步骤，而Gemini更喜欢输出直接而简洁的答案。

# AI行业动态

© 版权声明

文章版权归作者所有，未经允许请勿转载。

关注公众号，免费获取chatgpt账号

免费获取chatgpt

相关文章

Ai Pin惊艳亮相：激光投影、实时翻译、手势操控……AI硬件要被重新定义了？

ainavi

7,944 4000

白宫发文，呼吁开发者放弃C、C++：Rust被「钦点」内存安全

ainavi

6,212 1600

ChatGPT测试新功能：可自动根据上下文选择相关工具使用

ainavi

4,512 2000

通过深度学习预测离散时间分岔

ainavi

5,652 4001

生成式人工智能服务安全基本要求公开征求意见

ainavi

8,092 800

马斯克披露xAI细节：6年实现AGI，寻求真理，理解宇宙的本质

ainavi

11,292 1200

暂无评论

暂无评论...

AI中国(aicn.me)致力于收集与AI相关的热门工具，包括但不限于ChatGPT、AI视频、AI办公、AI语音等领域，并为广大AI爱好者提供学习平台，降低获取学习资源的成本。同时，同步分享最新的行业前沿AI工具和网站，旨在帮助AI爱好者不断探索AI技术的发展。

关于我们 AI教程

Copyright © 2024 优智创想智能工具导航粤ICP备2023063465号