搜索

影视聚合站

华为昇思:开源两年成果初现

发布时间:2022-03-29 21:35:31来源:中国电子报

华为全场景AI计算框架昇思MindSpore开源已有两年。3月26日-27日,昇思MindSporeTechDay活动在线上举办,华为面向开发者公布了目前开源进展和下一步计划。

两年开源将迎拐点

华为昇腾计算业务副总裁田昆阳说:“华为开源昇思MindSpore两年,年轻且充满活力,底层支持的模型类型和数量非常丰富,能够支撑全场景AI应用。”截至2022年3月,昇思MindSpore社区下载量突破140万,社区贡献者超4000人,服务企业数量超5000家,与120多个科研院所展开合作。

田昆阳说:“我们去年抓原生大模型,就是基于昇思MindSpore构筑的自主可控的大模型,鹏城神农、鹏城盘古、洛迦NET、紫东太初等是4个已经发布的大模型,在研发中的还有十多个,我们通过大模型收编小模型,做大泛化性、覆盖多场景,在这个赛道上我们还要坚持下去。”

目前,昇思MindSpore的开发者已经突破64万,核心贡献者近1500名,外部贡献者740名。“这达到了一种临界状态,外部的贡献者已经超过华为内部的编程人员,整体份额预估达到5.6%,开源两年已经打下一个很好的生态基础,拐点马上要到来。”田昆阳表示,今年随着南向芯片越来越丰富,我们希望未来整体份额能够达到20%。

华为将昇思MindSpore作为AI的根技术来培养,AI框架就是在实用数据上用AI算力孵化算法,因此AI框架是开发的必备工程,实际上也以看作是AI开发的操作系统。“我们把AI框架打造成根技术,根繁叶茂才能长久发展。”

此外,昇思MindSpore重心也放在培养人才上,一方面与教育部合作培养,另一方面计划打造昇思开源创新基地,通过社团运作等多种方式,目标要覆盖200多所科研高校,打下一个扎实的人才基础。

昇思MindSpore下一步重点

据昇思MindSpore首席架构师金雪锋介绍,昇思MindSpore在能力上下一步将有四个变化。

首先,昇思MindSpore在AI大模型上有很强的竞争力,已经支持了业界最多的并行模式,包括模型并行、流水线并行,做了很多大模型的训练和推理实践。比如鹏城盘古大模型、紫东太初多模态大模型等。同时在并行的编程接口上做了很多应用性的改进,在手动编程、半自动编程的基础上,今年将提供全自动的并行能力。工程师只需要像单机方式一样写程序就只可以。昇思MindSpore能实现全自动的并行部署和运行。

其次,今年可能会发布新的AI编程语言。随着在线AI训练系统越来越多,科学计算、AI+仿真新业务的拓展,Pathon在工业部署中性能的弱点逐步体现,华为希望通过自主研发编程语言能够比Pathon有很大的提升,目前这个编程语言已经开始进行内测。至于何时发布,金雪锋表示不急在一时,而是要等到编程语言的性能和易用性达到一定要求之后发布。时间点应该是在今年年内完成。

再次,昇思MindSpore今年将融入鸿蒙和欧拉生态,成为内置的AI引擎。在华为的数字底座体系中,鸿蒙是整个终端的底座,欧拉是整个ICT的底座,昇思MindSpore的融入,将使端、边、云真正融合起来。华为将会发布“AI+科学计算+数据分析”的融合解决方案,如已经公布的电磁仿真案例,今年年底会增加AI+数据融合的解决方案,方便开发工程师可以在多种混合业务上统一编程、部署和计算。

最后,要提升昇思MindSpore的易用性。过去两年,昇思MindSpore在功能易用性和完备性上有了不小的提升,但是这两方面一直还是弱点,今年易用性工作将是重中之重,从1.8版本开始会大力普及算子和API。

“如果之后你们看到成百上千的算子上线,大家不要惊讶。”金雪锋说,“经过今年的努力,我相信昇思MindSpore一定会让开发者用得越来越省心。

昇思MindSpore开源初见成果

在两天的线上会议中,来自华为和高校的开发者分享了昇思MindSpore1.6新版本、企业应用案例、AI大模型关键技术、AI+科学计算进展,也帮助开发者深入了解昇思MindSpore的技术创新之处和社区治理方式。

在分享的内容中,干货很多。昇思MindSpore1.6版本在易用性、开发效率、控制流性能等方面带来全新的升级:即时体验的开发套件MindSporeDevToolKit,一键环境管理,5分钟完成环境搭建;基于深度学习的智能代码补全,单模型开发键盘敲击次数可减少30%;开发全流程可视化,代码及对应的图结构及时查看,支撑集群训练性能问题的快速定位。

昇思MindSpore还展示了原生AI大模型成果。通过AI编译器实现多维度混合并行,支持数据并行、数据切片预处理等七维混合并行算法,这是并行维度业界最多、模型结构支持最全、单机容纳模型参数业界最强的AI框架,实现开发并行代码量降低80%、系统调整时间下降60%,单机完成千亿模型参数训练的超强能力。目前已训练出全球首个三模态大模型紫东.太初、全球首个遥感影像智能解译深度学习专用框架(武汉.LuojiaNet),并分别成立了“多模态人工智能产业联盟”和“智能遥感开源生态联盟”,开创了产业落地的新模式。

此外,在科学计算AI新赛道,昇思MindSpore通过架构创新,完成AI计算框架向AI融合框架的演进,通过神经网络模拟的非线性拟合,让科学家无需再解高维方程,提升科技创新效率,大幅度提高开发效率和科学计算性能。

作者丨刘晶

编辑丨徐恒

美编丨马利亚