《2023年度十大前沿科技趋势报告.docx》由会员分享,可在线阅读,更多相关《2023年度十大前沿科技趋势报告.docx(92页珍藏版)》请在优知文库上搜索。
1、I、曾簿楠:y人机交互新范式已被大模型打开Poi23D三JH三:新算;搦模型爆发,质量效率可控性日新月异P08分割模型k统:,计算机艘即将迎来GPTB寸刻P16*能斛三三:AG终极场景下的全新终端P225端三端自动驾驶触识:BEV+TransformerfflS术路线P29定ZB臃:肖费级产品问世,XR全栈链路打通P3571rRNA打开新象限:提供精准医疗新解法,开启生物医药新篇章P433月醐接口或佥新阶段:产品可靠性突破,A提升数据解码能力P49龌妙靡螂神翻邮迎来模式闭环P55C押臃涯制:U外诚功,打开商用想象空间P63其他提名前沿科技趋势P792024前沿科技投资观点结语智能体热潮:人机交
2、互新范式已被大模型打开AIPhaG。的胜利深刻启发了人们对智能体潜在影响的认识.7年后,大模型的崛起再次推动了AI智能体的发展,成为其强大的“动力引擎。2023年3月以来,产业界产生了多个杰出的AlAgent,如在游戏领域表现出色的英伟达VOyage喈能体、协助人们完成日常任务的幽理HyPerWrite,以及专注于提供个人情感陪伴的御手Pi等,AIAgem的研究取得了突破性的进展。ri11IIIIH推荐理由大模鲤研究与智能体研究宣窸互利目前,许多研究利用大模型作为AIAgent(AI智能体)的认知核心,模型的发展为智能体研究提供了质量保证。从智能体的角度来看待大模型,对大模型研究提出了更高的要
3、求,同时也扩大了大模型的应用范围。(1)大艇为智能体提供了突破性的技术方案过去基于深度学习框架的智能体能够学习技能,但无法真正理解问题和技能.而大模型智能体带来了深度学习新范式,从思维耀到思维算法的推理技术和强大的自然语言理解,这些大模型拥有的技术能力,有望让智能体具备强大的学习和迁移能力,从而让创建广泛应用且实用的智能体成为可能.(2)自主智能体实现复杂流覆自动化,流程效率大幡1升面对完善的自主智能体,当给定一个目标时,它们能自行创建任务、完成任务、创建新任务、重新确定任务列表的优先级、完成新的首要任务,并不断重复这个过程,直到完成目标.准确度要求高,因而更需要调用外部工具辅助减少大模型不确
4、定性的负面影响.(3)模寺露能触加拟人可信辘魄副物感和獭价值模拟智能体主要分为强调情感情商的智能体以及强调交互的智能体,后者往往出现在多智能体环境中,可能涌现出超越设计者规划的场景和能力,大模型生成的不确定性反而成为优势,多样性使其有里成为AIGC函要组成部分.(4藤入自主智能体的软件更符合用户的使用习惯在未来,大模型驱动的智能体极有可能带来交互方式的变革,从过去用户适应软件应用,变成应用软件适应用户个人习惯,为用户的生活提供更加便利的服务.IIM-basedAgent是大语言模型推理能力的展现,是一种能力,而不是一个完整的产品形态,这个转力可以应用于t。B和toC领域,EB领域对传统软件是一
5、种补充,toC领域如游戏、内容,对于内容分发有生成+推荐的结合机会。口明势资本从底层驱动力上看,我们认为主要有两类驱动力在推动着AIAgent的发展:技术驱动力:围绕AlAgent开发的技术框架、关键组件以及基础设施一直在过去的几个月中不断地演化和发展,并且,这种推动力不仅来自于闭源公司(如OPenAI),也来自于开源生态的努力(如Aut。GPT).随着底层技术的不断完善与成熟,我们已经看到Agent的开发者生态和应用生态正在逐渐壮大.商业驱动力:由于AlAgent具备重构现有互联网应用生态的潜力,因此从商业角度考虑,有望构建围绕Agentfi9新应用生态的公司都有比较强的动力去推动AlAge
6、nt的发展.在这之中,我们认为主要有几类玩家.一是LLM底层技术提供商,典型的代表就是OPenAI,他们不仅开发LLM底层技术,也会做GPTS的应用生态;二是硬件厂商,他们希望能够延续原先移动应用生态的优势,抓住A应用生态的机会;三是做开发生态和应用生态的玩家和创业公司,他们也希望从应用开发者和用户的角度切入做新的应用生态.BVS度风投H我们看好与LLM相关的整体技术栈,包括Agent技术。看好该技术的原因在于其重要性.我们认为AGl很可筑是提升整体生产力的核心技术,应用广泛性和对生产要素的替代能力具备划时代性特点,甚至可带动其他诸多前沿科技一起往前发展(如带动算力中的ChiPlet技术,带动
7、机器人中的具身智能技术,等等).而Agent将是迈向AGl的重要路径,目前已看到诸多海外研发进展.虽然道阻且长,我们对其抱有很大期待.口泰合资本随着AlAgent的逐渐普及和成熟,我们相信未来也会形成一个Agent与Agent、人与Agen啮行交互、侨作与价值交互CC的群体智能网络.在这样的群体智能网络之中,信息、商品、资金、服务可以高效地以Agent作为载体进行流动.I技术原理1. AIAgem原理AlAgent是能够感知环境并做出反应,通过决策和行动改变环境,并通过学习和反思持续迭代的智能体。此前,智能体经历了符号智能体、交互式智能体、基于强化学习的智能体和具备迁移学习和元学习能力的智能体
8、。在*模型爆发后,AlAgent就采用大模型作为智能体的核心组成部分,通过多模态感知和工具调用来扩展其感知和行动的范围。1.LM-basedAgent(基于大模型的智能体)集中了符号智能体推理规划的能力,具备了交互式智能体在反馈中学习、与环境互动的能力,同时具备大模型的少量泛化能力,在彳壬务间实现无缝转移,而无需更新参数.1.LM-basedAgent正是基于大模型驱动的Agent,可以实现对通用问题的自动化处理。自主智能体(AIAgent/AutonomousAIAgent)长久以来一直是人工智能界研究的焦点.曾经也出现过一些如SoAR的类似系统,但限于当时的技术水平,应用领瑚E常狭窄.随着
9、大语言模型的智能涌现,基于大语言模型的自治智能体拥有高度的智能水平,能够自主理解、拆解复杂、抽象的任务,也有更强的工具调用和感知外界反馈的能力,能够自我反思从而对问题提出更优解,甚至能够构建群体智能.我们判断基于大语言模型的智能体将最终成为人类良好的助手、同事和伙伴.口百度研究院基于强化学习的智能体需要建立基于具体场景的世界模型的仿真器,而LLM-basedAgent中大模型的强语言理解锢力使得与人相关的仿真器建设变得简单.过去没有大模型的情况下,需要穷举人的问答的各种情况,而现在通过大模型的语言理解能力,智能体就可以在和人的互动中纠正错误并继续逐步推理.口浦码科技1.LM-basedAgen
10、t架构1.LM-basedAgent(基于大模型的智能体)的架构可以总结为以下四个模块:配置模块、记忆模块、规划模块和行模块。ri配置模块记忆模块规划模块行动模块在配置模块,需要给智镌体提供待解决问题的背景信息,比如模拟人类时的年龄、性别、职业等基本言息,让智能体明确自身角色,智能体一股通过IT人员,教师和领域专家等特定角色来执行任务.记忆模块主要是传递知识,让智能体拥有长期和短期的记忆能力.智能体记忆从环境中感知到的信息,并利用记录的记忆来促进未来的动作.记忆模块可以帮助智能体积累经验、实现自我进化.并以更DUL合理、有效的方式完成任务.规划模块是智能体能力的核心,一个好的规划决定了智能体能
11、否顺利执行以及解决问题,规划模块首先将复杂任务分解为简单的子任务,然后逐一解决每个子任务,以及不断根据反债去函新调整策略。规划模块赋予基于大模型的智能体解决爱杂任务时需要的思考和规划能力,使智能体更Q面、强大行动模块的目的在将智挖体的决策转化为具体的结果输出.它直接与环境交互,决定智能体完成任务的有效性.基于大模型的自主智能体的架构AIAgent是指能第独立思考、自主行动并可以与环境交互的软件程序或机器人等实体.Agent包含三步:PPA,即感知(PerCePtion)-规划(PIanning)行动(ACtiOn).Al智能之父、图灵奖得主马文明斯基(MarvinMinsky)在1986年出版
12、了一本里程碑式的著作思维的社会(TheS。CietyofMind),试图解读人类思维这个豆杂的过程.MinSkyi为社会中的某些个体经过协商之后可求得问题的解,这些个体就是Agent,而Agent应具有社会交互性和智能性.口腾讯研究院规划层面思维算法(AlgorithmofThoughts)过去常用思维链(Chain-Of-Thought)和思维树(Tree-Of-Thoughts)来引导模型任务分解,利用大模型的上下文学习能力模仿类似的任务分解和规划,但这两种技术依赖于大模型的大规模查询,有时单个问题的查询数量可以达到数百个,导致计算效率的下降。微软联合弗吉尼亚理工大学推出思维算法(Algo
13、rithmofThoughts)具有动态和可变的推理路径,通过维持一条不断发展的思维上下文链条,提高了推理效率并减少了计算成本。这种方法的优势在于它能够灵活地适应不同的问题和情境,并且能够根据需要进行调整和优化。思维链、思维树、思维算法路缴批思维算法技术包括四个主要步骤:(1)将复杂问题分解为可理解的子问题,同时考虑它们的相互关系和单独解决的容易程度;(2)以连续和不间断的方式为这些子问题提出连贯的解决方案;(3)直观地评估每个解决方案或子问题的可行性,而不依赖于明确的外部提示;(4)根据上下文示例和算法指南,确定最有希望探索或回溯的路径.3.基于大模型的多智能体协同技术多智能体协同是指多个智
14、能体在共享环境中通过相互通信和协作,实现协同行动以达成共同目标的过程。每个智能体都具备一定的自主性和智能性,能够根据环境信息进行感知、决策不瞅行行动。Hf.IUae*ct*f4umCkMHtamdptMMMM*a.WtfvieMfmtamcaa*Rf.2Wrlerwnb*rwtwwMNI*lrvcNdM*c*w无线生成式智能体网络和设备架构图智能体之间通过网络交换知识、系统规划任务、采取行动并优化策略。其中知识是数据的抽象表示,将其编码为执行特定任务的大模电来自或机器的隘通过不同雌端(手机、电脑、智能车)提幅生成式智能体,这些终端设备通过智育琳给大模型创建提示,以完成每个步骤。任务在多个生成智
15、能体之间协同规划,能够最大化地利用不同大模型的知识和不同设备的功能。当从其他智能体接收到计划任务时,设备上的大模型可以从云端或其他设备上的大模型获取特定领域的知识。无线生成智能体具有观察环境的感知器(传感器)和执行决策的参与者(控制器)。设备上的大模型从观察到的多模态(文本、图像、声音)原始数据中提取语义信息,并将其存储在内存流中,以便将来规划新的任务。相应地,为了执行特定的任务,将检索相关的语义信息以采取行动.在从接收到的高级任务中完成计划的动作后,智能体可以进一步创建低级任务并将其发送给其他智能体以完成目标。多智能体协同技术的主要特征多智能体协同通过相互之间的交互与合作,使整个系统能够从各个智能体的优势和特长中受益,实现更高效、更智能的决策和行动.多智能体协同主要有以下特征:通信与信息共享决策与合作策略协同行动与集体效能智能体之间需要进行有效的通信和信息 共享,以便相互了解彼此的状态、意图和行动计划。通信可以通过直接传递消 息、共享知识库或传感器数据等方式来 实现.每个智能体在面临问题