上海AI实际室书生·浦语大模子升级:仅用4T数据考试而成

上海AI实际室书生·浦语大模子升级:仅用4T数据考试而成

IT之家 1 月 15 日音讯,IT之家从上海东谈主工智能实际室获悉,其书生大模子本日赢得弥留版块升级 —— 书生・浦语 3.0(InternLM3)。据官方先容,其通过高超数据框架大幅升迁了数据恶果,收场想维密度的跃升。

InternLM3-8B-Instruct 仅使用 4T 数据考试,官方声称其抽象性能跨越同量级开源模子,量入计出超 75% 考试本钱;初次在通用模子中收场了成例对话与深度想考才能和会,可应答更多的确使用场景。

基于司南 OpenCompass 开源评测框架,该模子运筹帷幄团队使用妥洽可复现的按次对该模子进行评测。评测给与 CMMLU、GPQA 等十多个巨擘评测集,维度包括推理、数学、编程、辅导奴才、长文本、对话及抽象证据等多方面性能,界限涌现,书生・浦语 3.0 在大巨额评测集得分当先,抽象性能“卓越接近 GPT-4o-mini”。

上海 AI 实际室流露了部分该模子的体验案例,如解答“箭头迷宫问题”等推理谜题,让模子在棋盘格中找到从开首到尽头的可行旅途。

以及“猜数字”问题:

此外,其深度想考才能也拓展到了智能体任务,成为了开源社区内首个因循浏览器使用的通用对话模子,因循 20 步以上网页跳转以完成深度信息挖掘。

体验页面:https://internlm-chat.intern-ai.org.cn

GitHub谄谀:https://github.com/InternLM/InternLM

HuggingFace谄谀:https://huggingface.co/internlm

ModelScope谄谀:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm3-8b-instruct






Powered by 数字视野网 @2013-2022 RSS地图 HTML地图