施展华
2026-04-02 19:46
近日,全球AI操作能力权威基准测试ScreenSpot-Pro榜单最新公布结果显示,珠海企业金智维科技凭借KV-Ground8B模型斩获全榜单第一,以更小模型实现更高性能,超越了包括更大参数规模在内的所有模型,彰显珠海企业在企业级AI领域的技术实力。

ScreenSpot-Pro是衡量AI“操作电脑”能力的世界级标杆,重点考察GUIGrounding技术能力,即AI根据自然语言指令,在高分辨率专业软件界面中精准定位按钮、菜单等控件的基础执行力。该测试覆盖办公、开发、设计、工程分析等23款真实应用,场景贴近企业真实应用,被多个主流GUI智能体项目采用。
在本次榜单中,金智维KV-Ground-8B模型以80.5分位列全榜第一,超越包括更大参数模型在内的多个竞品,这一成绩已接近人类操作水平,标志着AI从“理解指令”向“可靠执行”迈出关键一步。
不同于行业单纯追求大参数的思路,金智维通过专项技术优化,让不同规模模型均实现精度提升。小参数模型的领先表现,可以大幅降低企业AI部署成本:原本需数十万元服务器的算力需求,降至万元级设备即可满足,时延更低、性价比更高,有效破解企业AI落地“用不起、跑不动”的难题。
长期以来,企业智能体存在“理解易、操作难”的痛点:大模型懂任务却难执行,传统自动化工具灵活度不足。金智维此次技术突破,填补了AI理解与实际操作间的断层,无需改造现有系统,AI便可适配企业业务流程,助力企业实现从决策辅助到自主执行的升级。
“本次登顶榜首的ScreenSpot-Pro,是全球主流权威大模型评测榜单,几乎所有头部大模型均参与角逐。此前榜首谷歌Gemini3Pro得分72.7,金智维8B模型以80.5分实现超越,而80分以上通常被视作达到人类水平。”金智维首席AI科学家胡箐向记者表示,该榜单核心评测方向为界面识别能力,这是智能体实现精准执行任务的关键前提,即具备与人相当的“视觉识别精度”。因此,此次斩获榜单第一标志着金智维在智能体核心能力领域已达到国际领先水平。
据透露,目前金智维通过小参数模型实现高精度界面识别,意味着企业可凭借更低算力成本、更基础硬件配置,部署行业一流的AI能力,显著降低智能体落地应用门槛。
近日,全球AI操作能力权威基准测试ScreenSpot-Pro榜单最新公布结果显示,珠海企业金智维科技凭借KV-Ground8B模型斩获全榜单第一,以更小模型实现更高性能,超越了包括更大参数规模在内的所有模型,彰显珠海企业在企业级AI领域的技术实力。

ScreenSpot-Pro是衡量AI“操作电脑”能力的世界级标杆,重点考察GUIGrounding技术能力,即AI根据自然语言指令,在高分辨率专业软件界面中精准定位按钮、菜单等控件的基础执行力。该测试覆盖办公、开发、设计、工程分析等23款真实应用,场景贴近企业真实应用,被多个主流GUI智能体项目采用。
在本次榜单中,金智维KV-Ground-8B模型以80.5分位列全榜第一,超越包括更大参数模型在内的多个竞品,这一成绩已接近人类操作水平,标志着AI从“理解指令”向“可靠执行”迈出关键一步。
不同于行业单纯追求大参数的思路,金智维通过专项技术优化,让不同规模模型均实现精度提升。小参数模型的领先表现,可以大幅降低企业AI部署成本:原本需数十万元服务器的算力需求,降至万元级设备即可满足,时延更低、性价比更高,有效破解企业AI落地“用不起、跑不动”的难题。
长期以来,企业智能体存在“理解易、操作难”的痛点:大模型懂任务却难执行,传统自动化工具灵活度不足。金智维此次技术突破,填补了AI理解与实际操作间的断层,无需改造现有系统,AI便可适配企业业务流程,助力企业实现从决策辅助到自主执行的升级。
“本次登顶榜首的ScreenSpot-Pro,是全球主流权威大模型评测榜单,几乎所有头部大模型均参与角逐。此前榜首谷歌Gemini3Pro得分72.7,金智维8B模型以80.5分实现超越,而80分以上通常被视作达到人类水平。”金智维首席AI科学家胡箐向记者表示,该榜单核心评测方向为界面识别能力,这是智能体实现精准执行任务的关键前提,即具备与人相当的“视觉识别精度”。因此,此次斩获榜单第一标志着金智维在智能体核心能力领域已达到国际领先水平。
据透露,目前金智维通过小参数模型实现高精度界面识别,意味着企业可凭借更低算力成本、更基础硬件配置,部署行业一流的AI能力,显著降低智能体落地应用门槛。
-我已经到底线啦-


暂时没有评论