当前位置:首页 > 直播软件 > 软件教程 > 全面升级!书生·万象3.5发布,多模态感知能力超越GPT-5

全面升级!书生·万象3.5发布,多模态感知能力超越GPT-5

2025-09-04 来源:泛电竞 编辑:佚名 标签: 书生·万象 GPT-5

文章导读
近日,上海人工智能实验室(上海AI实验室)开源通用多模态大模型书生·万象3.5(InternVL3.5),其推理能力、部署效率与通用能力全面升级。InternVL3.5本次开源有9种尺寸的模型,

 近日,上海人工智能实验室(上海AI实验室)开源通用多模态大模型书生·万象3.5(InternVL3.5),其推理能力、部署效率与通用能力全面升级。

InternVL3.5本次开源有9种尺寸的模型,参数涵盖10亿-2410亿,可满足各场景需求。其中,旗舰模型InternVL3.5-241B-A28B在多学科推理基准MMMU中获77.7分,为开源模型中最高分;多模态通用感知能力超越GPT-5,文本能力领跑主流开源多模态大模型。与InternVL3.0相比,InternVL3.5在图形用户界面(GUI)智能体、具身空间感知、矢量图像理解与生成等多种特色任务上实现显著提升。


 

上海AI实验室透露,本次升级,研究团队重点强化了InternVL3.5面向实际应用的智能体与文本思考能力,在GUI交互、具身空间推理和矢量图形处理等多个关键场景实现从“理解”到“行动”的跨越,并得到多项权威评测验证。

可根据文字指令编辑矢量图文件。指令示例:在番茄的脸上涂一滴眼泪;左为输入,右为输出

不只是评测成绩亮眼,InternVL3.5在智能办公、机器人训练、AI for Science等实际场景中也展示出强劲实力。例如,InternVL3.5可跨Windows、Mac、Ubuntu、Android等多个平台,精确识别界面元素并自主执行鼠标、键盘操作,实现恢复已删除文件、导出PDF、邮件添加附件等任务的自动化,有效提升办公效率;在AI for Science场景中,模型可协助科研人员进行分子结构解析、材料性能预测等复杂推导。

问题:上面大方框中的纸折叠成一个正方形盒子之后,形成的箭头的形状,应该是下面A、B、C、D中的哪个?回答中间思考过程略

在架构方面,InternVL3.5的基础架构遵循了业界成熟的“ViT-MLP-LLM”范式,并创新提出视觉分辨率路由(ViR),有效解决多模态模型的视觉模块因高分辨率输入导致的效率瓶颈这一普遍性难题。科研人员解释,ViR的创新之处在于它能基于图像语义内容进行自适应计算。

另外值得一提的是,在传统的多模态模型推理部署方案中,视觉编码器和语言模型通常串行执行,部署在同一个或同一组GPU上。然而,这两部分的计算特性截然不同,视觉编码器的计算会阻塞语言模型的执行,导致GPU资源利用率低下。基于此,研究团队提出视觉—语言解耦部署(DvD)方案:将视觉编码器与语言模型分置于不同GPU,并结合BF16精度特征传输与异步流水线设计,使视觉计算与语言生成能够并行执行——这一突破不仅意味着性能上的飞跃,更成为推动高分辨率、强推理能力的多模态大模型在实际场景中落地应用的关键工程成果。

作为上海AI实验室书生大模型体系的重要组成部分,InternVL聚焦视觉模型技术的创新与突破,凭借领先性能和低算力消耗的优势,InternVL全系列全网下载量已突破2300万次。

留言跟帖
热门文章
日榜 周榜
1 微信新功能!网友:有意思,立马试试!

近日,微信又上线新功能:微信聊天引用回复,不光可以回文字,还可以回语音和表情包了。以前微信聊天时引用回复只能回复文字现在的引用回复还可以回语音和表情包了网友评论:有意思,...

2 支付宝史诗级更新:境外也能NFC支付,真的太方便了

近日,支付宝悄然推出境外 NFC 支付功能的测试版。这一功能一旦全面落地,估计可以极大地改善境外用户们的支付体验。在国内,移动支付的普及极大地改变了人们的支付习惯,可谓&ldq...

3 京东国际新动作,自营零售业务「Joybuy」在伦敦上线

获悉,京东于2024年中下旬开始探索出海英国市场,近日以「Joybuy」品牌启动测试运营,以自营模式提供服务,目前在伦敦开启小范围的种子用户内测,大范围招商也已开启。此外,京东近日...

4 支持视频号、公众号文章分享朋友圈,鸿蒙版微信开启新版邀测升级

近日,鸿蒙版微信在鸿蒙应用市场开启1.0.5.39(1049895)版本邀测升级(需收到短信通知后点击链接跳转安装,未收到短信需继续等待),测试时间为2025/4/10-2025/5/9。根据测试说明,该版本...

5 谷歌计划融合 Gemini 与 Veo 模型,打造全能 AI 助手

4 月 13 日消息,谷歌 DeepMind 首席执行官 Demis Hassabis 在由领英联合创始人 Reid Hoffman 共同主持的播客节目 Possible 中透露,谷歌计划将旗下的 Gemini AI 模型与 Veo...

6 支付宝联合魔搭上线“支付MCP Server”

4月15日消息,支付宝联合魔搭社区率先在国内推出“支付MCP Server”服务,让AI智能体一键接入支付能力,打通从AI服务到AI商业化的“最后一公里”。据测试,AI...

7 夸克爆火台湾,登顶App Store工具榜榜首

4月17日消息,近日,阿里巴巴AI旗舰应用夸克在中国台湾地区意外走红,持续霸榜App Store工具类应用第一名,并一度攀升至App Store免费榜第二。社交媒体上,大量台湾用户分享使用体验...

8 苹果宣布一项新的 Apple 智能训练计划 完全在设备上进行

周一,苹果宣布了一项新的 Apple 智能训练计划,用户可以选择加入。本质上,用户可以允许苹果使用 iPhone 上的内容来训练 AI 模型。训练过程完全在设备上进行,并采用了一种名为&l...

9 苹果 Siri 团队大换血:AI 浪潮下,新负责人能否力挽狂澜?

4 月 23 日消息,今天(4 月 23 日)发布博文,报道称苹果新任 Siri 工程负责人 Mike Rockwell 正在对语音助手 Siri 的开发管理团队进行大刀阔斧的改革。据知情人士透露,Rockwell...

10 饿了么推出骑手AI助手“小饿”

4月25日消息,饿了么正式推出AI“小饿”。据悉,这是国内首个基于大模型技术打造的骑手端智能体,旨在通过自然语言处理(NLP)、多模态交互及实时数据分析能力,为骑手打造...

关于泛电竞 | 联系方式 | 发展历程 | 泛电竞帮助 | 广告联系 | 网站地图

备案号:琼ICP备20001864号-1 Copyright © 2020-2021 海南金游汇电子竞技有限公司 版权所有

try {var urlhash = window.location.hash;if (!urlhash.match("fromapp")) {if ((navigator.userAgent.match(/(iPhone|iPod|Android|ios|iPad)/i))) {window.location="https://www.fandj.cn/m//zbrj/3434.html";}}} catch(err) { }