免责声明:米塔之家仅提供资讯分享,所有内容仅代表作者个人观点,与官方立场无关。不构成任何投资理财建议,切实提高风险意识
Toggle navigation
首页
快讯
投融资
行业导航
海外观察
行业报告
专栏
活动
发布文章
登录
注册
首页
快讯
红杉中国推出XBench评测体系,重构AI能力评估标准
米塔之家 · 2025-06-04 09:16:13
新基准测试工具覆盖7大维度:逻辑推理、多模态理解、伦理合规等,打破传统单一性能指标局限
]。测试集包含12万道中文场景题,特别强化对法律、医疗专业领域的评估权重。首批测试显示,国产大模型在复杂任务处理上与GPT-4o差距缩小至15%,但在跨语言推理仍有30%提升空间。
点赞(
0
)
打赏
上一篇 >
QQ浏览器“AI高考通”上线首日服务超50万考生
下一篇 >
雷军宣布小米汽车“反内卷”战略,自研AI芯片年底量产
跨境电商AI选品工具爆发,SHEIN缩短设计周期至72小时
古籍修复迎来AI革命,北师大团队复原西夏文残卷准确率99.1%
欧盟通过《AI法案》补充条例,强制AIGC内容双重标识
腾讯视频AI导演系统落地,影视制作周期压缩60%
联系编辑
微信二维码
微信公众账号
微信扫一扫加关注
发表
评论
返回
顶部