2024中国生成式AI大会上海站开幕！首日大模子峰会燃爆魔都

发布日期：2025-01-01 15:21 点击次数：61

作家 | 智东西剪辑部

智东西12月5日报谈，今天，以“智能跃进创造无穷”为主题的2024中国生成式AI大会（上海站）崇拜开幕，大会现场高朋满座。

大会为期两天，共有50+位嘉宾基于前瞻性视角为寰球解构和把脉生成式AI的本领居品创新、贸易落地解法、将来趋势走向与前沿揣度焦点。

大会首日，由复旦大学筹商机科学本领学院证实注解、上海市智能信息处理实验室副主任张奇领衔，17位嘉宾围绕通用诳言语模子、多模态大模子、行业大模子、垂直大模子、智能体、具身智能、大模子对皆与安全、投资风向等前沿议题，共享了最新的研发与实践劝诫。

“大模子本领算作东谈主工智能领域的紧迫分支，正在不休鼓动着产业的创新和转型。”上海市东谈主工智能行业协会副布告长徐琦在致辞中示意，“在此配景下，举办这次生成式AI大会，旨在进一步鼓动上海市生成式AI产业的发展，促进院校和揣度机构的学术效果传播，同期，加强与长三角地区优秀企业和机构的联动疏通，共同探索东谈主工智能的将来发展之路。”

▲上海市东谈主工智能行业协会副布告长徐琦

徐琦指出，上海一直在AI领域演出着引颈者的脚色。产业限度方面，上海限度以上AI企业已从2018年的183家增长到2023年的348家，产业限度从1340亿元增长到3808亿元，居天下前线。创新效果方面，现时上海已有46款大模子通过备案，多款通用东谈主形机器东谈主原型机发布。产业生态方面，上海加速打造创新载体，诱骗企业集合；不时优化算力基础措施布局，加大算力资源统筹供给；完善语料数据基础支柱体系。

面向将来，上海将紧紧把抓通用东谈主工智能发展机遇，与海表里企业、机构等良好协作，不时鼓动东谈主工智能创新发展，加速塑造高质料发展新动能、新上风。

算作智一科技倾力打造的产业峰会IP，2024中国生成式AI大会由智东西和智猩猩和洽主办，这次会议卓绝3000东谈主报名参会，现场高朋满座。中国生成式AI大会已在北京见效举办两届，这次是中国生成式AI大会初度登陆上海举办。

智一科技和洽创举东谈主、CEO龚伦常代表主办方为大会致辞：“七年前，咱们的首届AI产业大会在上海见效举办，崇拜开启了咱们在AI领域举办产业峰会的征途。7年后，咱们的生成式AI大会再次回到上海。”他提到与生成式AI大会北京站比拟，上海站大会从产业和本领两个维度，围绕模子、AI Infra、应用、本领四个方针对内容进行了升级。

▲智一科技和洽创举东谈主、CEO龚伦常

龚伦常还预报了本年以及来岁多个紧迫会议——下月初，第四届全球自动驾驶峰会将在北京举办；2025年上海车缓期间也将举办产业峰会；2025年，AI芯片、生成式AI等领域品牌峰会将不时举办。接待寰球参会。

一、高端对话：大模子是百年一遇新分娩力创新，热聊成本商场新风向

高端对话门径以“大模子时期，成本商场的新风向”为主题，由智一科技和洽创举东谈主、智车芯产媒矩阵总剪辑张国仁主办，靖亚成本结伙东谈主任晓东、BV百度风投扩充董事温永腾、达晨财智晨云子基金结伙东谈主朱翔就生成式AI投资策略、大模子商场边幅、大模子贸易化旅途等话题共享不雅点。

张国仁谈谈，从社会的发展来看，这一波生成式AI引颈的科技发展是百年一遇的新分娩力创新，不管是个东谈主交互陪伴，如故生计、责任、学习都在发生一轮新变革。但不管风向如何调动，咱们对AI新本领的发展仍保持好意思好向往。

▲智一科技和洽创举东谈主、智车芯产媒矩阵总剪辑张国仁

靖亚成本结伙东谈主任晓东以为，大模子居品分为公有云和迥殊化两类，公有云由于本领开源，大厂易完了导致初创公司契机一丝；在迥殊化部署上，初创公司不错证据企业场景进行定制部署，大厂在这方面上风不明显。另外，在AI基础措施软件领域，创业公司要是选拔开源则难有算作，难以和大厂进行竞争。

他还强调，在AI投资中，合规是第一原则，要合适国度战略规矩以及与LP坚毅的公约，什么领域不可投资、什么应该泄露等都给以顺服。

▲靖亚成本结伙东谈主任晓东

BV百度风投扩充董事温永腾说，BV自2021年起密集眷注生成式AI创企，从来源到现时，一直以为生成式AI会重塑内容分娩和分发方式，Diffusion的出现让他们在多模态领域找到了生数科技甚尽头他模态方朝上的优秀公司。现时，AI Agent的发展使其运行念念考对智能劳能源的投资。

Sequoia Capital（红杉成本好意思国）分析，旧年全球生成式AI的贸易化达30亿好意思金。产业中很出丑到一个刚运行受眷注一年的商场方针，在一年内就完了纷乱的收入增长。因为大模子公司大宗都顺服强研发参加的运营模式，融资和贸易化都是关节问题，尤其是B端贸易化的表现如故需要时期和耐烦。但他投诚完了更大增长的这一天一定会来，仅仅时期问题。

▲BV百度风投扩充董事温永腾

达晨财智晨云子基金结伙东谈主朱翔谈谈，国内大模子创企仍在追逐OpenAI的节拍，处于武备竞赛阶段，且部分公司因融资问题发展较慢。

生成式AI领域运行流露与OpenAI不同的老师方针，如世界模子和具身智能。近期，李飞飞和谷歌DeepMind发布了新世界模子，新的Scaling Law通过合成数据鼓动更高效的模子生成，不错灵验幸免Scaling Law放缓的问题。

朱翔说，具身智能是AGI的关节载体，但面对高老师成本和硬件限度等挑战。他展望，具身智能量产前可能会资历2-3年的“瓶颈期”，期间部分公司将退出商场。

▲达晨财智晨云子基金结伙东谈主朱翔

二、大模子的才调范畴在哪？音视频才调进阶，创新架构流露

在本日大会上，复旦大学筹商机科学本领学院证实注解、上海市智能信息处理实验室副主任张奇深刻解读了诳言语模子的才调范畴及发展念念考，MiniMax副总裁刘华探讨了大模子本年大模子发展要点的变化，西湖大学助理证实注解张驰共享了全场景通用的单目深度意象大模子，北京大学（临港）大模子对皆扩充中心主任、北京阿莱门科技有限公司CEO徐骅辩论了模子安全。

张奇以为，大模子发展迅速但现时仍处于“记忆阶段”。大模子老师有不同阶段，从学问压缩和示意学习、才调注入到生成式任务才调提高，老师只需要相配少的数据，完成某个领域学问问答仅需要60条老师数据，但“如何加数据”是最难的问题。

▲复旦大学筹商机科学本领学院证实注解、上海市智能信息处理实验室副主任张奇

他让大模子作念了本年高考数学题后发现，大模子在数学运算中的筹商过程和谜底选拔不一致。扫尾标明，模子虽能完成特定任务推理，但并非竟然得回了与东谈主一样的才调。

张奇记忆大模子发展有两条旅途：一是伴随OpenAI，以替代通盘脑力业绩为策画；二是不追求替代通用任务，只完成特定事情。最关节的是落地场景选拔和大模子才调范畴判断。

关于本年大模子领域的变化，MiniMax副总裁刘华以为，与2022-2023年基础大模子在文智商域才调的马上提高比拟，2024年基础大模子才调的提高更全面，体现时了文本、语音、音乐、视频等多个领域。

他示意，现时多模态大模子已赋能我国的千行百业，转动为新质分娩力。比如，MiniMax在国内服务了3万多家客户；公司的视频大模子受到180个国度AI创业者的爱好，并在文化创意、电商直播等领域得到了闇练应用。

▲MiniMax副总裁刘华

他判断，多模态大模子仍处于快速发展阶段，尚未看到模子才调的上限。面向将来，MiniMax将陆续快速迭代自研的多模态大模子，并聚焦于裁汰模子造作率、完了无穷长的输入和输出、鼓动多模态愈加当然交融这3个方面。

西湖大学助理证实注解张驰共享了全场景通用的单目深度意象大模子，在科罚传统单目深度意象方式痛点方面的念念考。传统单目深度意象方式依赖激光雷达等专科缔造，数据采集难度大、成本高，导致数据少且散布。基于AI大模子，其不错更高效地诈欺大数据老师、视觉大模子先验和老师优化范式，从而追求全场景泛化。

▲西湖大学助理证实注解张驰

同期，他提到Zero-shot单目深度意象方式胜在活泼易搭载，可应用于机器东谈主、自动驾驶、AI文生3D、AI图生3D等领域。

西湖心辰CEO、西湖大学深度学习实验室效果转动负责东谈主醒辰先容了西湖心辰在AI心理意会与多模态长程对话领域的探索与效果。他们团队自创立以来便死力于研发超拟东谈主的情商型大模子，以适配各式触及复杂心理的东谈主机互动场景。旗下自研的多模态通用基座大模子“西湖大模子”摄取深度对皆本领与多模态心理识别本领，增强了AI的心理识别与需求意会才调，让东谈主机长程对话成为现实。

▲西湖心辰CEO、西湖大学深度学习实验室效果转动负责东谈主醒辰

本年该公司推出的国内首个端到端通用语音大模子心辰Lingo，补足了语音交互才调，让AI更像东谈主、懂东谈主心、说东谈主话。这些“超拟东谈主”本领已被应用于心辰旗下的AI热情推敲陪伴居品“聊会小天”。

大模子创新本领的演进也在加速。RockAI CTO杨华共享了非Transformer架构大模子Yan在端侧的实践。Transformer架构虽在大模子领域取得纷乱见效，但东谈主们也运行念念考是否过度依赖它以及现存大模子形态的可不时性。

▲RockAI CTO杨华

Yan架构包含类脑激活机制和MCSD，前者参照东谈主脑神经聚集，后者在老师时可充分诈欺GPU筹商才调，裁汰功耗。基于此架构的多模态大模子在手机、电脑、机器东谈主、无东谈主机、树莓派等端侧缔造上均可部署，且模子具有强盛的教唆伴随才调、多应用场景。自主学习、群体智能亦然RockAI在大模子领域的念念考和探索。

AI应用的安全至关紧迫。北京大学（临港）大模子对皆扩充中心主任、北京阿莱门科技有限公司CEO徐骅分析了大模子安全与实用性的矛盾，共享了多模态对皆的探索。

▲北京大学（临港）大模子对皆扩充中心主任、北京阿莱门科技有限公司CEO徐骅

徐骅谈谈，过度追求安全可能糟跶实用性。为此，他漠视了价值对皆决议，设定“3H原则”（Helpful、Honest、Harmless）为策画，确保模子合适东谈主类价值不雅。他强调，Aligner对皆器决议在多模态场景中平衡安全与实用性，下一步将聚焦提高模子在医疗、训导等领域的适配才调，按捺东谈主类行家上限，鼓动AGI发展。

三、AI落地拐点时刻，智能体、3D生成、具身智能成焦点

大模子的落地应用是2024年的热门话题，具身智能、3D生成、AI智能体、音乐生成等创新玩法数以万计。

1、端到端具身多模态大模子，对准机器东谈主泛化

星河通用机器东谈主联创结伙东谈主、大模子负责东谈主，北京智源东谈主工智能揣度院具身智能PI张直政博士谈谈，具身智能从模子到居品再到新质分娩力，仅眷注“任务自动化”还不够，星河通用正在追求的是“经由自动化”。而完了这一丝的关节在于诈欺大规师法真合成数据驱动机器东谈主从底层朝上完了环境感知与动作技能学习才调的按捺。从将3D小模子与动作大模子联结的大模子系统到端到端具身多模态大模子，星河通用全面布局，要点提高机器东谈主在竟然场景中的泛化责任才调。

▲星河通用机器东谈主联创结伙东谈主、大模子负责东谈主，北京智源东谈主工智能揣度院具身智能PI张直政博士

谈及将来，他以为具身智能的发展方针是“机器东谈主大脑、小脑与硬件推行”协同进化，要点眷注其在“经由自动化”中的泛化性按捺，从而鼓动机器东谈主在推理与扩充当务中愈加高效、智能地完成更复杂的移动操作任务。

2、3D、音乐生成到达爆发节点，展现多场景贸易化应用后劲

在3D生成方面，VAST CTO梁鼎分析了在大模子加持下，3D AIGC的发展与应用。在他看来，3D和其他多模态大模子发展历程雷同，都会资历从本领积贮到某个时期点爆发的过程，3D现时照旧到了爆发节点。

▲VAST CTO梁鼎

他以为3D AIGC在多个场景都能进行贸易化应用，如在传统游戏影视动画中完了降本增效及带来新玩法；工业中能完了3D打印定制化分娩；酬酢直播电商等元天地领域也可应用，还能用于定制玩物及与训导联结。

2024年是AIGC音乐爆发元年，趣丸科技副总裁贾朔以为，东谈主工本领的创新发展大大裁汰了音乐创作门槛，国产AI音乐的歌声当然度更是按捺东谈主耳识别阈值，效果并排好意思国头部模子。他共享了东谈主与音乐的AI交互神色的变化，从文生音乐，到三键成曲，再到哼唱成曲。本年6月份，天谱乐全球首发多模态音乐生成模子，支柱视频成曲和图片成曲功能，一键证据用户视频或图片生成一首完满的音乐。

▲趣丸科技副总裁贾朔

此外，贾朔在现场初度预报了天谱乐的新功能——MidiRender，模子如团结个精确、可控音乐版的Control Net，可依据原创音乐片断填充歌词、完成编曲。

3、法律、医疗垂直赛谈模子落地，蚂蚁加速AI贸易化

华院筹商大模子和学问推理算法负责东谈主蔡华拆解了华院法律大模子的底层本领架构尽头5大主要落地场景。一般的通用大模子不及以粉饰法律领域的需求，为了让大模子更适用于法律专科领域，该公司网罗了多源异构学问数据，包括6大类型的基础学问，并以法条和案件为中心节点搭建关系图谱。

▲华院筹商大模子和学问推理算法负责东谈主蔡华

现时，其应用场景主要分为法治业务和法治决策两大板块，具体有类案保举、法条保举、判决告示生成、普法反诈宣传数字东谈主一体机和小雪东谈主法律智能助手等。

腾讯优图实验室天衍揣度中心负责东谈主、行家揣度员吴贤提到了现时基于医疗大模子的十大应用场景，包括科室导诊、大夫保举、预问诊、医患对话领域的病情追问、病例生成、出院小结生成、医药学问回话、临床执业医师测验、药企里面着力提高以及医学科普著作生成。

▲腾讯优图实验室天衍揣度中心负责东谈主、行家揣度员吴贤

他还先容了在消弱大模子幻觉，话语不平衡问题，大模子评测问题，以及多话语，多模态医学任务上的最新揣度表现。

蚂和洽团基础智能本领部总监赵耀共享了诳言语模子在业务中的应用以及如何通过本领技能科罚推理着力、可靠性和可用性问题。蚂和洽团通过学问蒸馏和学问迁徙，平衡了推理着力与精度，其中蒸馏将大模子学问转念至小模子，减少筹研讨并保持精度；学问迁徙匡助模子快速得当不同场景，提高应用效果。

▲蚂和洽团基础智能本领部总监赵耀

此外，蚂和洽团还通过压缩和剪枝本领裁汰成本与能耗，提高筹商着力，减少硬件参加。公司策画是鼓动AI贸易化，普及应用。

4、AI Agent已完了具体算法落地，商务场景应用价值突显

AI Agent的多模态感知、记忆增强和推理才调正逐渐提高，联汇科技CEO兼首席科学家赵天成谈谈，行业正在从“LLM-First”转向愈加合适东谈主类融会的“Agent-First”架构。通过新算法，AI Agent大要在视觉信息不明晰时动态放大画面并进行信息分析，从而提高多模态感知才调，使7b模子推理精度不错超越gpt-4o大模子，达到接近东谈主类基准的水平。

▲联汇科技CEO兼首席科学家赵天成

在推理、记忆和感知三个中枢场景中，AI Agent照旧完了了具体的算法落地。联汇科技推出了全面开源的Agent框架，通过构建法度化的基本框架支柱AI Agent不时优化。

WeMeet荟神基于大模子构建了多智能体商务互联平台，WeMeet荟神创举东谈顾客学斌提到AI在商务场景应器用有多方面紧迫价值。

▲WeMeet荟神创举东谈顾客学斌

举例为商务东谈主士配备的AI助理；在不同话语环境下为商务活动提供支柱匡助东谈主们跳跃话语阻截进行疏通；科罚商机生成的问题，让潜在买家和产业卖家之间的相干愈加良好；还不错快速生成会议应用等。终末，他还强调了安全问题，要作念好生成式AI服务备案，确保商务场景下AI应用褂讪、可靠地发展。

结语：初度落地上海，共探中国生成式AI产业脉搏

除上述嘉宾外，还有6位后生学者和本领行家鄙人午的端侧生成式AI本领研讨会上进行了干货共享和圆桌Panel辩论。

继贯穿在北京举办两场聚焦生成式AI的高规格创新峰会，今天，智东西与智猩猩初度落地上海和洽举办聚焦生成式AI领域的行业嘉会，但愿通过丰富的议程配置、多元化的嘉宾劝诫共享与不雅点碰撞，让寰球不虚此行。

明日精彩陆续，25位产学研代表将围绕AI Infra、AI视频生成、具身智能等议题，共探中国生成式AI产业的脉搏。

热点资讯