上海AI实际室书生·浦语大模子升级：仅用4T数据考试而成

发布日期：2025-02-21 06:47 点击次数：86

IT之家 1 月 15 日音讯，IT之家从上海东谈主工智能实际室获悉，其书生大模子本日赢得弥留版块升级 —— 书生・浦语 3.0（InternLM3）。据官方先容，其通过高超数据框架大幅升迁了数据恶果，收场想维密度的跃升。

InternLM3-8B-Instruct 仅使用 4T 数据考试，官方声称其抽象性能跨越同量级开源模子，量入计出超 75% 考试本钱；初次在通用模子中收场了成例对话与深度想考才能和会，可应答更多的确使用场景。

基于司南 OpenCompass 开源评测框架，该模子运筹帷幄团队使用妥洽可复现的按次对该模子进行评测。评测给与 CMMLU、GPQA 等十多个巨擘评测集，维度包括推理、数学、编程、辅导奴才、长文本、对话及抽象证据等多方面性能，界限涌现，书生・浦语 3.0 在大巨额评测集得分当先，抽象性能“卓越接近 GPT-4o-mini”。

上海 AI 实际室流露了部分该模子的体验案例，如解答“箭头迷宫问题”等推理谜题，让模子在棋盘格中找到从开首到尽头的可行旅途。

以及“猜数字”问题：

此外，其深度想考才能也拓展到了智能体任务，成为了开源社区内首个因循浏览器使用的通用对话模子，因循 20 步以上网页跳转以完成深度信息挖掘。

体验页面：https://internlm-chat.intern-ai.org.cn

GitHub谄谀：https://github.com/InternLM/InternLM

HuggingFace谄谀：https://huggingface.co/internlm

ModelScope谄谀：https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm3-8b-instruct

热点资讯