阿里云通义开源首个推理模范评估模范

阿里云通义开源首个推理模范评估模范

1月16日,阿里云通义开源全新的数学推理经过奖励模子Qwen2.5-Math-PRM,72B及7B尺寸模子性能均大幅越过同类开源经过奖励模子;在识别推理失误模范才调上,Qwen2.5-Math-PRM以7B的小尺寸就越过了GPT-4o。同期,通义团队还开源首个模范级的评估模范 ProcessBench,填补了大模子推理经舛裂缝评估的空缺。(全天候科技)






Powered by 数字视野网 @2013-2022 RSS地图 HTML地图