《计算机行业专题投资策略研究报告精品.docx》由会员分享,可在线阅读,更多相关《计算机行业专题投资策略研究报告精品.docx(47页珍藏版)》请在优知文库上搜索。
1、计算机行业专题投资策略研究报告目录1 .盘古大模型的优势体现在哪里?41.1 30亿参数CV模型+千亿级NLP大模型业界领先41.2 泛化能力极强、适用大量复杂行业场景913工业化Al开发模式赋能干行百业102 .盘古初上,百业Al将兴超强泛化能力,盘古推动AI行业落地。122.1 盘古CV大模型:聚焦分类、分割.检测等视觉场景132.2 盘古NLP大模型:聚焦文本生成与内容理解162.3 盘古科学计算大模型:致力于解决科学计算问题182.4 盘古多模态大模型:聚焦跨模态理解、检索与生成203 .投资建议213.1 神州数码:IT分销龙头223.2 麒麟信安:国产操作系统主力军243.3 中国
2、软件:软件行业国家队273.4 诚迈科技:领先的操作系统专家293.5 海量数据:国产数据库领航企业313.6 易华录:数字经济基础设施建设和运营商343.7 航天宏图:空天信息领域领军363.8 万达信息:智慧城市信息服务领先者393.9 常山北明:常山云建设者,华为核心战略伙伴常山北明拥有软件、纺织双主业。413.10 拓维信息:华为全栈IT产业链合作伙伴431 .盘古大模型的优势体现在哪里?应用场景纷繁复杂叠加作坊式的开发模式导致传统AI模型商业化落地较难,具体来看:一方面,传统的AI开发模式下,一个场景对应一个模型,数据质量差、样本少,模型精度差,并且应用场景相对单一。不同行业、不同场
3、景对AI的需求既复杂且碎片化,每个痛点都需要进行定制化地开发和改造,同时AI人才相对稀缺,很多企业通过人工进行AI应用的开发,从而导致成本高、效率低、落地慢,投入产出不成正比。此夕一旦应用场景发生变化,整个模型可能需要重新开发。另一方面,作坊式开发模式限制了AI生产力的释放。传统的AI开发模式效率相对较低,AI技术的企业渗透率仅在4%左右,AI算法从理论上能够极大提升产品及服务的价值量,但由于开发过程中存在大量的碎片化因素,不同的应用场景往往需要独立的架构设计与调参,效率相对较低。小作坊式的AI开发模式无法实现规模化应用,AI生产力受到了一定程度的限制。1.1 30亿参数CV模型+千亿级NLP
4、大模型业界领先盘古大模型从2020年启动研发,2021年4月正式发布,到2022年聚焦行业应用落地,其进化路径可分为L0-L1-L2三个阶段,上层是在下层的基础上演化而来。LO是指基础大模型,包括NLP(中文语言)大模型、CV(视觉)大模型、多模态大模型、科学计算大模型以及Gr叩h(图网络)大模型。自然语言处理(NLP)系列是业界首个千亿级生成与理解中文NLP大模型,由华为云、循环智能和鹏城实验室联合开发,在训练过程中使用了40TB的中文文本数据,其中包含大量的通用知识与行业经验,具备领先的语言理解和模型生成能力,并通过行业数据的小样本调优提升模型在场景中的应用性能。在中文语言理解评测基准CL
5、UE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新了三项榜单世界历史纪录,总排行榜得分83.046(人类水平为85.61),多项子任务得分业界领先。在NLPCC2018文本摘要任务中,盘古NLP大模型取得了Rouge平均分0.53的业界最佳成绩,超越第二名百分之六十。此外,基于提示调优、动态冰化等一系列正则化技术,NLP大模型还实现了小样本学习任务超越GPT系列。图裹1:叠古NLP大模型位列CLUE榜单总播行榜第一计算机视觉(CV)系列为业界最大的CV模型。其包含30亿+参数,在业界首次实现了模型的按需抽取,可以在不同部署场景下抽取出不同大小的模型,动态范围可根据需求覆
6、盖特定的小场景到综合性的复杂大场景,实现了在ImageNet上小样本学习能力业界第一。盘古CV大模型致力于解决AI工程难以泛化和复制的问题,使得研发成本降低90%。此外,盘古CV大模型提供模型预训练、微调、部署和迭代的功能,形成了AI开发完整闭环,极大提升了AI开发效率。CV(视觉)大模型已成功应用在铁路巡检、国家电力巡检等场景。华为南方工厂的PCB版质检即借助了盘古CV(视觉)大模型进行展开,目前正被更多制造企业应用在工业质检环节。科学计算大模型主要解决各种科学问题,如气象预报、海浪预测、分子动力学预测、微分方程求解等,旨在利用AI促进基础科学的发展。多模态大模型具备图像和文本的跨模态理解、
7、检索与生成能力,通过跨模态语义关联实现视觉-文本-语音多模态统一表示,采用一个大模型即可灵活支撑图-文-音全场景AI应用,可用于产品设计、艺术创作、语音播报、海报创作等领域。Graph(图网络)大模型首创图网络融合技术,在工艺优化、时序预测、智能分析等场景有广泛应用,如预测企业财务风险、制造企业优化工艺等。在时序预测场景下,图网络大模型可协助中央空调系统进行可挥发气体浓度的预测、智能监测空气质量,同时可以帮助零售企业进行销量预测。在工艺优化场景下,图网络大模型则可以帮助制造行业优化工艺、降本增效。图表2:盘古基础大模型包括五大类模型来源:华为云宜网.国金证券研究所1.l是指行业大模型,是在LO
8、基础上导入行业数据进行训练后衍生出的模型,如盘古金融大模型、盘古矿山大模型、盘古电力大模型、盘古制造质检大模型、盘古药物分子大模型等行业大模型。L2是指在Ll基础上结合行业细分场景得到的推理模型。以在电力行业为例,华为云基于盘古电力大模型,针对无人机电力巡检细分场景,通过一次预训练+下游任务的微调,推出盘古电力巡检大模型,解决了无人机智能巡检系统(缺陷检测)中的小样本学习、主动学习、增量学习等问题,同时解决了海量数据标注工作量大和缺陷种类繁多的问题。此外,在华为云AI生态中,通过开源开放,盘古大模型充分借助开发者和合作伙伴的力量,如将Ll行业大模型开放给ISV伙伴等,将大模型的能力进一步下沉到
9、场景,从而打造开放生态。总的来看,盘古大模型分为三个训练阶段:一是预训练,利用海量数据进行预训练得到通用基础模型,二是微调,针对下游行业具体任务,结合行业数据进行微调;三是大模型迭代,结合不断产生的新数据和之前训练使用的数据,实现大模型的终身学习。图表3:女古大模型进化路径可分为LgJT2三个阶段目前,盘古大模型已经在100多个行业场景完成验证,包括能源、零售、金融、工业、医疗、环境、物流等等。盘古NLP大模型涉及千亿参数、40TB训练数据,对算法、算力、海量数据处理、并行优化都提出了很大挑战。在算法方面,华为云算法团队和循环智能(ReCUrrentAl)的NLP团队联合攻关,突破了大模型微调
10、的难题。鹏城实验室的国内最大规模AI训练集群鹏城云脑II在盘古NLP大模型训练中提供了强大的AI算力和数据吞吐能力,为盘古大模型训练打下坚实的基础。此外,华为底层软件、训练框架、ModeIArts平台协同优化,充分释放算力,达成了全栈性能最优。具体来看,首先,针对底层算子性能,盘古大模型基于华为CANN采用了算子量化、算子融合优化等技术,将单算子性能提升30%以上。其次,华为MindSpore创新性地采用了流水线并行、模型并行和数据并行的多维自动混合并行技术,大幅降低了手动编码的工作量,并提升集群线性度20%o华为云ModeIArts平台提供E级算力调度,同时结合物理网络拓扑,提供动态路由规划
11、能力,为大模型训练提供了最优的网络通信能力。通过借助ModeIArts平台的高效处理海量数据能力,仅用7天就完成了40TB文本数据处理。一站式AI开发平台ModeIArts为盘古大模型训练和推理提供计算优化、通信优化、存储优化以及算法优化,是盘古大模型重要的基础平台资源。图表4:ModeIArts为盘古大模型训练和推理提供计算优化、通信优化、存储优化以及算法优化大模型推理大模型训练算法优化优化JSAdamAdaFadorSGo模型“始化参敷复用NAS统一调练优化引擎优化对畀什多树木畀行镇型井行源桢务行MOE才行多笫度薨合并行模型自动切分功名修山第JelJO-HD 内M体(FP16& 稀 M)I
12、调从优化I 4 I 量岛A I KJ岛A I$馋度遇佶优化多维内存优化支计算 CPU Offload&Swap内存复用 NVMeOffload算十内为行.atchin多流井行、长BiF理统一推理优化引擎运行讨模型用编勇枚 I 圣山 在由线!化循年优化囹优化 门动用优化 PASS H 算刊IUt ”于代网1戌J 4yH公.#十耳Il性能分析工关保tft*分析生效糖同步分布式缓存近i*MR毓伶动W维客OBSitwe4*:督东西拗情公众等.国企证券”完所1.2 泛化能力极强、适用大量复杂行业场景盘古大模型具备极强的泛化能力、一个模型适用大量复杂行业场景。在toB以及toC场景下,盘古大模型具备良好的
13、泛用性,大规模参数的模型可以更深层挖掘数据背后的逻辑,达到更高的泛化性能,对不同场景的鲁棒性更强,原来需要多个模型覆盖的视觉场景,大模型可以用一个模型覆盖多个场景,以此解决模型碎片化问题。盘古大模型吸收了海量数据知识,盘古NLP大模型学习了40TB的中文文本数据,CV大模型包含了30亿+参数,并通过行业数据的小样本调优,提升了模型在场景中的应用性能,提高了大模型的泛化能力以及算法对新鲜样本的适应能力,从而提高模型的学习能力,减少对领域数据标注的依赖。在大多数工业场景,从海量数据搜集缺陷样本耗时耗力,盘古大模型能够实现缺陷样本高效筛选,节省了80%以上的人力标注代价。止的卜,基于产业场景中存在大
14、量的内容理解需求,盘古大模型采用兼顾架构,在预训练阶段沉淀了大量的通用知识,能够同时完成理解与生成任务,使得大模型有能力支持行业知识库和数据库的嵌入,对接行业经验。随着盘古大模型的开放,各行各业的开发者不必再从零开始,只需在云上找到所需要的模型,盘古大模型相当于各个行业AI通用的轮子,助力各行各业加速智能化转型。4:华为云方同.国金谴支所在面向开发者方面,盘古大模型逐步上线到华为云AI资产共享社区,通过提供相对通俗易用的工作流以满足开发者的AI开发需求,充分释放预训练模型能力,从而实现和开发者共建生态。大模型在实际场景中的应用不仅可以帮助用户提高训练进度并且缩短训练时间,随着模型上应用数量不断
15、增多,用户成本亦会有所降低。13工业化AI开发模式赋能千行百业预训练+下游微调的工业化AI开发模式赋能千行百业。相对于传统的作坊模式AI开发过程,盘古大模型是一种工业化AI开发的新模式,可以解决小模型的定制化难题,使一个模型应用到多个场景中。一方面,盘古大模型AI开发门槛较低,能够提供自动化工作流,自动生成模型,减少对AI开发工程师的专业依赖,同时可以根据更新数据快速进行模型迭代,做到边用边学。另一方面,盘古CV大模型首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求,同时能够融合行业知识的微调,快速适配各种下游任务。盘古CV大模型已经在100余项实际任务中得至U验证,大幅提升了业务测试精度,能够节约90%以上的研发成本。此外,盘古CV大模型在预训练阶段主要集中在数据处理、架构设计和模型优化三个阶段进行优化。目前盘古CV大模型在ImageNet1%.10%数据集上的小样本分类精度上均达到目前业界最高水平。S4L6:叁古CV工作流工作模式来秀:隼为云雷网,国会建春印支用总的来看,盘古大模型提升了复杂场景下的小样本学习能力,在小样本学习上提升了一个数量级的效率;在微调能力上,盘古大模型有着更