作为源于产业实践的开源深度学习平台,百度飞桨致力于让深度学习技术的创新与应用更简单。飞桨以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。飞桨助力开发者快速实现AI想法,创新AI应用,作为基础平台支撑越来越多行业实现产业智能化升级。
中教全媒体:飞桨定位是源于产业实践的深度学习平台,如何理解人工智能领域的深度学习?
马艳军:我们正处于第三次人工智能浪潮,这波浪潮就是以深度学习为核心。2006年,深度学习的方法极大提高了机器自学习的能力,推动人工智能应用迎来爆发期。当前,深度学习技术已经具备了很强的通用性,正推动人工智能进入工业大生产阶段。
但是,深度学习的开发和训练难度是很大的。深度学习框架的出现,能让开发者不用从0到1搭建地基,而是可以像搭积木一样,从框架平台模型库中选择或组装自己需要的模型,然后导入数据进行训练、实现部署,让企业、开发者能更快速、便捷开发AI应用,避免重复“造轮子”。
国家对深度学习技术和框架高度重视,十四五规划中明确提出,瞄准新一代人工智能等前沿领域,在核心的“新一代人工智能”领域,要加强深度学习框架领域技术攻关。2017年,国家发改委正式批复由百度牵头筹建深度学习技术及应用国家工程实验室,这是业内首个也是目前唯一深度学习国家工程实验室;5年以来,该实验室取得丰硕成果,飞桨产业级深度学习开源开放平台就是最核心的成果,让中国人工智能底层基础技术与国际巨头并驾齐驱,并在部分领域实现了国际领先。
中教全媒体:请您具体介绍一下飞桨深度学习平台?目前发展情况如何?
马艳军:飞桨是百度自主研发的中国首个开源开放、功能丰富的产业级深度学习平台,以百度多年的深度学习技术研究和业务应用为基础。目前飞桨已汇聚超过477万开发者,位列中国深度学习平台市场综合份额第一。
飞桨集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,同时还包括飞桨企业版零门槛AI开发平台EasyDL和全功能AI开发平台BML。飞桨不仅能够助力开发者快速实现AI想法、上线AI业务,也能帮助越来越多行业完成AI赋能,实现产业智能化升级。
飞桨自2016年开源至今,已经取得多项业内第一,体现在以下五个方面:
1)市场份额:根据国际权威调查机构IDC报告显示,2021年飞桨已位居中国深度学习平台市场综合份额第一。
2)生态方面:构建了全球前三、中国第一的AI开发者生态,凝聚了477万开发者、创建了56万个模型,服务了18万家企事业单位。
3)软硬件协同:截止2021年底,有超过20家国内外硬件厂商、30种以上的芯片适配飞桨。国产芯片适配第一。
4)开源方面:飞桨在开源社区的影响力中国第一。《2021中国开源年度报告》显示,2021年GitHub中国项目活跃度 Top 30中,飞桨占据了5个项目,其中飞桨框架位列第一。
5)技术方面:基于百度二十余年积累的全球领先的人工智能技术,深度学习专利申请量世界第一;飞桨支持训练了中文语义理解最强的文心大模型。
中教全媒体:飞桨的核心技术领先性体现在哪里?
马艳军:飞桨具备四大领先技术:开发便捷的深度学习框架、超大规模深度学习模型训练技术、多端多平台部署的高性能推理引擎、产业级开源开放模型库。
开发便捷的深度学习框架
飞桨深度学习框架基于编程一致的深度学习计算抽象以及对应的前后端设计,拥有易学易用的前端编程界面和统一高效的内部核心架构,对普通开发者而言更容易上手并具备领先的训练性能。飞桨自然完备兼容命令式和声明式两种编程范式,是业内首个实现动静统一的深度学习框架,开发者默认使用动态图编程调试,一行代码即可转静态图训练部署。飞桨框架还提供了低代码开发的高层API,并且高层API和基础API采用了一体化设计,两者可以互相配合使用,做到高低融合,兼顾开发的便捷性和灵活性。
超大规模深度学习模型训练技术
飞桨突破了超大规模深度学习模型训练技术,率先实现了千亿稀疏特征、万亿参数、数百节点并行训练的能力,解决了超大规模深度学习模型的在线学习和部署难题。此外,飞桨还覆盖支持包括模型并行、流水线并行在内的广泛并行模式和加速策略,推出业内首个通用异构参数服务器架构、4D混合并行策略和端到端自适应分布式训练技术,引领大规模分布式训练技术的发展趋势。
多端多平台部署的高性能推理引擎
飞桨对推理部署提供全方位支持,可以将模型便捷地部署到云端、边缘端和设备端等不同平台上,结合训推一体的优势,让开发者拥有一次训练、随处部署的体验;飞桨从硬件接入、调度执行、高性能计算和模型压缩四个维度持续对推理功能深度优化,整体性能领先;在硬件接入方面,飞桨拥有硬件统一适配方案,携手各大硬件厂商软硬一体协同优化,大幅降低硬件厂商的对接成本,并带来领先的开发体验,特别是对国产硬件做到了广泛的适配。
产业级开源开放模型库
飞桨建设了大规模的官方模型库,算法总数达到500多个,包含经过产业实践长期打磨的主流模型以及在国际竞赛中的夺冠模型;提供面向语义理解、图像分类、目标检测、图像分割、文字识别(OCR)、语音合成等场景的多个端到端开发套件,满足企业低成本开发和快速集成的需求,助力快速的产业应用。飞桨的模型库是基于丰富的产业实践打造的产业级模型库,服务企业遍布能源、金融、工业、农业等多个行业。其中产业级知识增强的文心大模型,已经形成涵盖基础大模型、任务大模型和行业大模型的三级体系。
基于以上技术优势,飞桨形成了两大核心特色:一是产业级,源于产业实践并与各行业的AI应用场景紧密结合;二是低门槛,提供了一整套的产品矩阵,方便开发者和企业选择。
中教全媒体:作为产业级深度学习平台,飞桨能够为行业解决哪些应用场景下的痛难点问题?能否介绍一些代表性案例?
马艳军:智能化升级已成为当下行业发展的重要趋势。但企业智能化升级面临许多问题:例如核心技术能力不足、人力成本高、领域专业性强等,延缓了企业智能化升级的脚步。
飞桨作为产业级深度学习开源开放平台,立足于产业的实际需求,将人工智能技术以更低的成本、更高的效率渗透至行业中去,降低千行百业智能化升级门槛、提升智能化升级效率,加快行业创新、创造经济效率和社会效益。值得一提的是,结合技术基础和产业实践经验,飞桨推出业界首个产业实践范例库,从真实产业场景分析、完整代码实现到详细过程解析,直达项目落地,覆盖数十个高频应用场景,推动AI落地可复制和规模化。
目前,飞桨不仅在百度搜索、信息流等自身业务中实现大规模应用,还在金融、能源、工业制造、交通等多个领域实现应用落地。
例如在能源行业,飞桨与中国石油旗下的昆仑数智科技有限公司合作打造“梦想云”AIoT平台,深度融合油气应用场景,通过视频采集和飞桨图像分割、语义理解、目标检测等多方向AI技术能力,实现大量智能化分析和预测,打造出安全合规性检查、大型机装设备故障诊断、机器人智能巡检、特定动作识别以及油气生产优化方面一系列行业智能化应用和解决方案,有效避免了事故发生、保障了石油化工企业安全,助力油气行业数字化转型、智能化发展。
在交通行业,专注于轨道交通领域行业解决方案的成都国铁电气设备有限公司,采用飞桨 PaddleDetection目标检测套件等解决了 AI 算法难题,研发了一套“轨道在线智能巡检系统”,实现了对轨道巡检图片的实时检测。该系统可同时安装到工程作业车和运营电客车上,能够在不影响电客车正常行驶的情况下,全天候对轨道缺陷实施智能判断,目前已在深圳地铁的相关线路上试运行。
中教全媒体:飞桨在助力工业大生产第一线的同时,也在不断加强产学研合作力度。飞桨在推动高校人工智能人才培养生态方面如何布局,取得了怎样的成果?未来还有哪些计划?
马艳军:基于飞桨在技术、产品、生态上的深厚积累,飞桨在2020年推出“大航海”计划,包括面向未来AI人才培养的“启航”计划,面向产业智能化升级的“护航”计划,面向核心开发者的“领航”计划;“大航海”计划在2021年升级为2.0,新增“共创计划”:以飞桨平台为基座,社区开发者共创工具、模型、产业案例与实践经验;形成产业创新需求对接平台,共创产学研用正循环;与生态伙伴一起建设人工智能产业赋能中心,共创区域创新生态。
其中,“启航”计划聚焦高校AI人才培养,计划3年内投入价值5亿元的资金与资源,深度合作全国500所高校,联合培训5000名AI师资,助力培养50万AI学子。“启航”计划所发布的《AI人才产教融合培养方案》,从教学资源、工具与平台、服务三大层面为高校提供丰富多样的资源支持,推进AI产学研实践的深入开展。
在教学资源层面,飞桨致力于为高校提供一套以数据及产业案例为基础的立体化课程资源。经过多年应用与积累,飞桨拥有源于产业实践的海量数据集,可助力高校教学实践。同时,飞桨的案例库可多场景助力高校教学落地,产业实践案例横跨智慧城市、工业/能源、智慧安防、智慧交通等11大领域。以数据集及产业实践为基础,飞桨为学校提供多适配性的课程体系及立体化教学资源,三大课程体系包括根据AI专业培养方案建设的“AI专业学分课程体系”、源于飞桨产业特色的“AI+X特色方向课程体系”及注重产品实现能力培养的“AI微课程体系”。
工具与平台层面,飞桨深度学习平台集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体,可以为不同理论基础的学生提供阶梯式的“成长型”应用体验。对于能够使用核心框架进行研发的同学,飞桨框架拥有易学易用的前端编程界面和统一高效的内部核心架构,不仅更容易上手并具备领先的训练推理性能,学生可以获得极佳的开发体验。对于刚刚接触AI的学生,飞桨提供了零门槛AI开发平台EasyDL,有助于学生快速体验AI开发的感觉。EasyDL支持零算法基础定制高精度模型,为学生提供了最为全面的定制化训练场景,覆盖7大技术方向、16种任务类型。此外,飞桨拥有国内最大一站式AI学习与实训社区AI Studio,其教育版是专业的AI教学平台,具备教、学、管、评、测功能,为高校教学提供亿元免费算力支持。社区中有产业级开放数据集、300万公开项目、6000学时在线课程、国赛等110场 AI 大赛。更包括广受师生欢迎的名师经典课程专区,汇集AI名师经典教材与飞桨共建课程。在硬件教具方面,飞桨提供面向多学科、多应用场景的实践教具支持。各类边缘计算盒及终端,均可无缝衔接百度大脑开放的AI能力,海量AI技能自由选择。同时支持硬件定制,支持多模型、高精度模型部署。
服务层面,飞桨集合了面向教师和学生的11项服务。截至2022年6月,飞桨已累计开展师资培训28期,共培训870余所高校的3900名专业AI教师,支持340余所高校开设AI课程,在高校教师队伍中受到广泛好评。百度与中国计算机学会于2020年联合创立的松果基金,面向青年学者提供经费、平台、数据、技术支持等服务,基于飞桨进行人工智能技术研究,通过为期一年的开放或半开放型课题项目,推动合作双方在前沿技术探索与实践方面的深度合作,从而推进我国国有深度学习平台在科研领域的应用。这是国内唯一基于自主研发深度学习框架的青年学者科研基金项目。同时,面向不同年级的学生,飞桨推出企业师资、竞赛组织与培训等八大服务,全面立体化辅助学生AI能力成长。其中,企业师资服务融入企业育人实践,贯穿学生成长全过程。通过开设特色实践课程、提供高质量的实践及前沿指导,将产业理念、技术、资源整合到培养体系、课程及实训中,最大程度共享及优化配置产教资源,培养高素质和具有产业应用视角的创新人才。比赛方面,飞桨每年组织及承办80余场各类赛事,包含由教育部等多部委共同主办的中国国际“互联网+”大学生创新创业大赛、由教育部高等学校自动化类专业教学指导委员会主办的“全国大学生智能汽车竞赛”、由全国高等学校计算机教育研究会主办的“中国高校计算机大赛—人工智能创意赛”(简称C4)等五大国赛,此外还有国际大数据竞赛、百度之星开发者大赛等热门赛事,吸引海内外多所名校学子共同参与。
目前,飞桨与浙江大学、复旦大学、清华大学、山东大学等高校分别在区域性教学平台、特色软件学院、AI+X教学竞赛、区域性创新中心等方面进行了深入合作。未来,飞桨还将围绕AI+复合型人才培养持续探索,加强校企联合力度,共创产学研用正循环。
作者:张晓攀
评论前必须登录!
注册