百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜 李子锋摄
人工智能(AI)技术在快速发展和成熟过程中,在与各行各业、大量场景进行结合时,存在这样的问题:新技术与行业场景的结合能否更加有效果、有效率?能否通过基础的平台性的能力,支撑起产业在科技创新中的大量需求?
我们所打磨的人工智能开源开放平台,就致力于为产业提供这样的底层支撑作用。
为何需要自主创新的AI平台
AI技术与产业应用结合时有几个特点:通用能力具有可复用性、结合场景的应用需要多技术融合、产业落地需要生态链多角色协同,等等。基于此,建设基础共性平台是有必要且可行的。同时,AI应用会涉及数据,拥有可靠的自主创新平台也是产业安全的重要保障。
产业级深度学习开源开放平台“飞桨”就是这样的基础平台。在日益发展的算力、数据能力支撑下,百度飞桨平台,下接芯片,上承各种应用,成为AI技术研发的基础底座。因此,建设我国自主创新、技术领先的深度学习平台具有重要的科技战略价值。
企业应用AI的三个阶段
在飞桨与伙伴的广泛合作中,我们观察总结了企业从开始尝试使用AI技术到将AI大量应用于业务场景中,一般来说,可分为三个阶段。
首先是“AI先行者探路”,即企业中有少数先行人员尝试引入AI进行原型验证,这个阶段中,是否有现成可用、满足应用场景的模型库,对于先行者来说非常重要。
以智能质检举例,在质检场景,对模型的准确率和漏检率都有极高的要求,模型的性能和吞吐量也有高要求,质检瑕疵种类往往也很多,而产线上的样本数据获取也尤其困难,必须要有基于产业场景的模型库,来支持高效的原型验证。而训练得到了符合要求的模型并不能代表验证完毕,还需要将模型集成到系统中取得应用价值,需要有适配各种软硬件平台的部署工具,并且与模型库打通,才能快速集成部署应用起来。
当进行了验证取得了最初几次AI应用的效益后,企业会从少数先行者的实践转变成建设团队来学习和应用AI,这便进入第二阶段——“AI工作坊应用”。
进入这一阶段的企业会建设一定规模的AI团队,进一步将新技术与科技能力引入业务。比如,与我们合作过的某工业制造企业的系统研发部 AI 团队,共12名成员,其中有4名机械、化工工程师(非计算机专业人员),7名数据、硬件、软件工程师(非AI的计算机专业人员),只有一位AI专业的研发人员(AI算法工程师、平台架构师)。这样的团队在引入AI能力过程中会进行新技术的学习,进而加以应用。
从深度学习核心模型研发的视角来看,提供无代码。可视化开发模式,可以不用开发代码也能先用起来。如果进行一些开发工作,可基于场景套件,通过“复用”的方式也能快速地用起来现成的技术。如果希望面向场景增加定制以获得更有针对性的效果,可以在套件的基础上,进行参数配置调整。
再进一步,还可以对模型进行改写,甚至在框架的基础上自主研发,实现自主创新。在这个过程中,原有的团队人员也会从使用者逐渐转变为开发者,其工作效率及创新性也会提升。因此,飞桨平台注重提供多层次的产品体系以满足开发者不同层面的需求。
第三阶段,当企业进行大量的AI应用,几百、几千人一起工作,多人多任务协同生产,就进入了“AI工业大生产”阶段,更长期看,还会实现社会化协同大生产。
比如有的企业研发人员数千人,他们使用庞大的算力,在几百个场景应用了大量AI技术。这时,面向算力需要高效的管理调度平台,面向研发人员需要易用的全流程开发环境。当前,飞桨也正是基于以上核心能力,依托于不同的建模方式以“双平台”模式,分别面向AI应用开发者和AI算法开发者,提供给使用者方便好用的AI开发平台。
AI人才培养愈加重要
千行百业拥抱AI,人才建设需先行。
AI人才培养有三个层次:首先需培养基础理论研究型人才,以高校和科研机构为主开展;第二是基础软硬件研发人才,像飞桨平台这类基础软件项目会带动基础软件研发人才的成长;第三是产业应用方面,急需培养既懂原有业务逻辑、又能够把新技术引入并应用起来的AI复合型人才。基于飞桨平台,我们通过培训、竞赛、社区交流等方式让更多人才把AI技术学起来、用起来。
依托飞桨平台,依靠自身积累的丰富人工智能实践经验,从2018年起,我们联合各方发起面向高校教师的全国高校师资人工智能培训活动,迄今已培养2900多位高校专业教师,服务近700所高校,并支持200多所高校开设AI学分课。面向企业,飞桨推出的AI快车道、AI私享会、首席AI架构师培养计划等培训,让前沿技术深入业务场景,目前已覆盖了万余名不同层级开发者、上千家企业,向业界输送了190名AI架构师,遍布工业、能源、金融、交通、农业、互联网等数十个行业,与多领域企业合作实现AI赋能应用落地案例。
截至目前,飞桨已汇聚360多万开发者,基于飞桨开发了40万个AI模型,累计服务13万企事业单位。他们来自于工业、农业、医疗、城市管理、交通、金融等各行各业,AI应用的多样化和规模化正在加速。
我相信这只是开始。基础通用的技术和产业结合,产教融合培养未来人才,还会持续不断地发展壮大。在这个过程中,开源开放平台会成为产业科技创新的基础支撑。通过平台支撑、人才培养,再加上生态建设,最终会促成产业的繁荣发展。
(作者系百度集团副总裁、深度学习技术及应用国家工程实验室副主任,本报记者赵广立根据其在第十三届创新中国论坛上的发言整理)