字节跳动智能创作团队近日宣布,他们联合北京交通大学、北京科技大学的研究人员提出了首个无需依赖 SAM 的高效像素级推理大模型 PixelLM。 研究团队表示,PixelLM 能够熟练处理任意数量的开放域目标和多样化的复杂推理分割任务,同时避免了额外的、成本高昂的分割模型,提升了效率和对不同应用的迁移能力。在三个 benchmark 的绝大多数指标上,PixelLM 的性能均优于其他方法,且由于 PixelLM 不依赖于 SAM,其 TFLOPs 远远低于同尺寸的模型。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
关注公众号,免费获取chatgpt账号
相关文章
暂无评论...