人工智能
张亚勤院士:中国智能产业持续增长的背后是人才和技术
青贝克智慧工场 | 来源:青贝克智慧工场 浏览次数:521
摘要:

张亚勤:目前全球局势虽然复杂多变,但中国经济继续表现强劲,特别是中国智能产业目前保持了28%的增长,其背后的重要因素就是人才和技术。那么智能计算的未来趋势如何发展?

编者按:在第二届中国人力资源智能化论坛上,清华大学智能产业研究院院长张亚勤以《智能计算新趋势》为题做了主旨发言。以下为演讲实录:

张亚勤:目前全球局势虽然复杂多变,但中国经济继续表现强劲,特别是中国智能产业目前保持了28%的增长,其背后的重要因素就是人才和技术。那么智能计算的未来趋势如何发展?

1 新一轮数字化是翻天覆地之变

当然,人工智能是影响最大的领域之一,除此之外有三大行业也影响巨大,即生命科学、绿色计算和自动驾驶。

过去三十年最重要的就是数字化,而我们进入的新一轮数字化是3.0时代,就是说物理世界在全方位数字化,如汽车、道路、交通灯、城市发展、工厂,甚至是家庭(电网)等都在数字化。

同样,生物世界也在数字化,例如大脑、器官、DNA、蛋白质、细胞等,以及基因组学、蛋白质组学、转录组学、代谢组学,都是数字化的表征。

新一轮的数字化和前两轮数字化大相径庭:

第一轮数字化是内容的数字化,比如图像、视频、声音、音乐等,都是自然的内容。

第二轮数字化是企业的数字化,即信息化。

第三轮数字化不同之处在于,第一是数据规模天文级的指数型上升,比如无人驾驶每天的数据量是3-5(T),基因测序的数据量是3T,而蛋白质三维结构的数据量有10的300次方左右数量级,所以数据量比起图像数字化或企业ERP、HR等都是天文级的。第二是现在的数据主要是给机器做决策的,不是给人做决策的,所以这是很大的不同。

美国学者尼葛洛庞帝(Nicholas Negroponte)在1996年出版的《数字化生存》一书中提出,“我们的内容在数字化,所以原先是从原子到比特,(原子是物理世界的单位,比特是信息世界的单位),现在我们又从比特回到了原子。”其实比特世界和原子、分子世界在相互映射,这就是数字孪生的概念。

同样,人工智能过去六十年也经历了很多变革,曾经历过两次寒冬。但现在人工智能处于新的黄金时代,其中最重要的就是数字化和大数据。而最早的人工智能是知识,以当时的符号、逻辑和推理为起点的知识,但仅仅知识是不够的,所以就出现了很多问题。

到了专家系统的发展阶段,包括现在的深度学习(机器学习),其实都是以数据驱动为中心的。如果是知识和数据相结合,那么人工智能的3.0也好,4.0也好,就都是新的发展趋势。

2 是时候需要新算法和新架构了

深度学习的十年,的确改变了很多技术和产业:

感知:语音识别、人脸识别,包括物体识别和分类(即感知层基本达到人类的水平)。

认知:如对语言的理解、视频的理解、内容的理解,包括翻译、知识图谱等,还是与人类有一定距离。

挑战:主要包括隐私安全、数据保护、治理、伦理和法规,以及透明性和可解析等。整体来讲,人工智能自己不应该有伦理体系,其价值观、伦理体系也不必追随人类。

深度学习主要包括:一是需要大量的数据,二是需要算法方面的演进,三是需要算力。其中,算力的要求基本上超越摩尔定律,可能每年是10倍的增长。

我不完全同意Jeff Dean和Google Fellow所说的数据要加上100倍的算力。算力的确十分重要,全区唯一标识磁盘分区表(GPT)从1、2发展到3,如今有上千亿的参数,可以处理上万台的图形处理器(GPU)。

这在中国应用场景中需要更大的模型来运行,包括鹏程盘古、致远悟道、浪潮1.0等,包括微软地图,基本都比GPT 3的模型大差不多10倍左右的数量级,所以需要更多的数据和计算。

而计算必须要突破这些限制,过去有三大定律在制约着整个产业的发展,即相同定律、冯诺依曼架构和摩尔定律。那么现在都需要去突破,实现人工智能进一步发展,所以需要用到新的架构,比如新的感知,包括激光雷达、3D结构传感器、光传感、生物传感。

由于现在新的算法增加,所以架构需要改变。特别是冯诺依曼架构已经不再适用大部分场景,这需要更多异构的计算,也需要大量吸收举证的算法。所以现在出现的芯片,都有加速器,比如专用AI芯片的AC加速器。

过去不做芯片的公司也开始做芯片了,比如百度昆仑、谷歌TPU等,为什么?

因为这些互联网企业有大量的人工智能应用场景,以及工作流,所以需要有很强的算力,而芯片比传统的GPU甚至IPG的性能好十倍、百倍,甚至是千倍,因此芯片行业的发展目前一片繁荣。

长期来看,我们需要新的计算范式,目前就有很多研究,例如类脑计算、量子计算、光计算和生物计算。

同样,计算的架构也在变化。早期的大型机是完全中央处理,所有的计算和数据全部在IBM大型机中运作,直到PC机出现后才完全分布处理,到了云计算时代又开始集中处理,而现在又走向分布式处理,这就是云+边+端的协同智能。预计在未来五年左右,95%以上的智能和计算都在边缘端,而不在云端。

3 生物世界的数字化和智能化

首先影响最大的可能是生命科学和医学,就是生物世界快速的数字化,产生天文级的组学数据。另外一个趋势是整个生物实验可以自动化运行,这是新的实验范式,即拿到样本后在机器上做实验,做完实验后得到数据再用人工智能的算法来进行计算。

还有AI科学计算,刚才讲过人工智能是数据驱动的,但在生物科学等很多地方其实是有科学原理的,包括量子层面也有确定的方程式。

第一,人工智能对基因编辑的加速发展。包括gRNA、Cas9和递送系统的设计与优化,疾病治疗靶点发现,精准基因编辑治疗等。

第二,在抗体、TCR、个性化疫苗方面快速发展。此领域的AI算法完全改变了过去发明药物的方法论。传统意义上的发明药物一般需要至少三年,然后做测试、临床,最后到批准需要很长的周期,但新药的发明周期大大缩短到3-6个月,甚至更短。

当然,其中也有很大的挑战,就是做计算机、做人工智能的人,如何与做生命科学的人有共同的语言?所以我们现在做的一件事就是AI for life science,即破壁计划。如何把两个行业打通?其实定义一个好的问题、学习任务、数据集和最佳实践是能具体操作的,包括基础设施、芯片架构、数据平台,以及人工智能的算法引擎。

从一维序列到三维结构本身就是一个科学问题。同样,比如我们每年解析出蛋白质后,其数据集就越来越多,可参考和研究的样本量就越来越多。所以一个好的科学问题,加上数据量的不断增加,以及新的人工智能算法不断推出,相互融合后的准确度就会不断增加。

现在我们处在后AlphaFold2时代,但也是AI和大分子制药的黄金时代,现在科研大部分都在小分子阶段,像TCL最近有许多新的研究进展,包括抗体抗原的发现,还有干湿融合等等。

4 AI + IoT助力“碳中和”

其次影响最大的领域是绿色计算。现在的气候、能源都面临巨大的挑战,原先从煤炭时代到油气时代,现在要进入碳中和时代,所以这就是中国持续发展的必然选择。

但同时也是整个产业结构调整的大机遇,尤其人工智能在其中还有很多可助力的地方,主要有三个方面:

首先是智能感知,即多源多维异构感知融合。

然后是智能决策,即数据驱动+AI优化引擎。

最后是配置优化,即多参数全链系统配置优化。

在能源融合方面,其实有很多物联网(IoT)感知应用场景,包括从发电(火电、核电、水电、风电或太阳能)融合到主电网里,如何储能?以及对碳排放的监测、智能机组控制优化、智能载荷感知、智能负荷预测、智能调峰与调度均衡、线网故障检测及预警、用电系统节能优化等,都有很多作用。

计算机和通信这两大行业的碳排放要降下来,大数据中心其实是一个很大的排放源。到2035年,中国数据中心的排放耗电量就是4500亿度。另外是通讯行业,5G虽然是特别好的一项通信技术,但缺点是功耗比较高,因为基站多的原因,要把功耗逐步降下来。还有就是人工智能算法本身的运算也在排放,通过NAS训练Transformer(big)模型将产生约284吨二氧化碳的排放,所以也要降下来。

随着更多的数据、更好的算法出现,排放量一定会减得更多。

5 自动驾驶是人工智能集大成者

第三影响最大的领域是自动驾驶。百度的自动驾驶产业目前是最大的开放平台,也是技术方面最先进的平台。

为什么要关注自动驾驶?

自动驾驶最重要的是解决安全问题,比无人驾驶之后的安全程度至少会提高10倍,否则不能上路,现在90%以上的交通事故是人为的,而人工智能可以避免这些事故的发生。

自动驾驶未来是大产业,在未来10年会有万亿美金的投资新机遇,对科技工作者来讲也是一次技术方面的挑战。

自动驾驶融合了很多方面的技术,包括环境感知、决策控制、虚拟仿真、高精地图、高精定位、车载系统、车载硬件、智能互联、人机交互和系统安全。

当然,自动驾驶有很多关键问题,有技术性的也有非技术性的,有市场性的也有非市场性的。在技术方面,自动驾驶等级在L4、L5级时是无人驾驶的,L4以下还是有人驾驶的等级,自动驾驶到底是否可以实现?答案是一定可以实现。其中,自动驾驶是以视觉为主,通过各种各样的传感器进行道路判断,比如激光雷达可以根据人工智能来判断是否需要。

在路线图方面,到底是单车智能为主还是车路协同?是需要渐进式还是需要跳跃式L4+?简单来讲,自动驾驶等于模拟人类的大脑感知、认知、决策和执行等,而且还要实时安全。

所以要从一开始去采集各种各样的数据,然后有视觉的感知、激光雷达感知,以及有动态或静态的定位系统,最后很好、很快、很安全的融合在一起做决策,决策后再回到角色进行驾驶,驾驶后回到云端平台,其中有仿真的、有数据的各种车辆的平台,最后又回去做采集数据的工作。

其实人们在开车时构建出一个三维实时的模型,如果算上时间是四维,这需要驾驶员去预测Dealt T值,即碰撞的概率,所以驾驶车辆本身是很复杂的行为。

视觉也可以做到无人驾驶,但本身的安全性和稳定性会有限制。比如用激光雷达后,会出现一个新的维度,驾驶时可以直接感受到三维立体的信息,包括车辆方位、速度,以及驾驶员位置等,主动信息和深度信息相结合才是最佳结果。

当然,单车智能或车路协同,本身一定是智能的,有了更多道路信息,无人驾驶才会开的更好。

比如无人驾驶车辆正常行驶中偶遇救护车,如果是单车智能的话,就无法准确避让,但如果道路或路灯中有摄像头,那车辆的激光雷达就可以掌握救护车的信息,两组信息相融合后就会增加安全性。

我们现在的研究为的是把智能发挥到极致,当然这一前提是要找到厉害的人和正确的人。当年我和李开复一起组建微软亚洲研究院,其中80%的工作就是在找人,现在仍然是在找人。

所以现在我们的确处在一个黄金时代,第一次工业革命是蒸汽时代,第二次工业革命是电气时代,第三次工业革命是信息时代,而前三次中国所扮演的角色虽然不同,但基本都是旁观者或跟随者。

第四次工业革命是智能时代,而且智能将成为技术的引擎。中国研发的投入、经济的体量、政策的优势等,都可以让我们成为第四次工业革命的领军者。

特别声明:
转载上述内容请注明出处并加链接。上述内容仅代表作者或发布者的观点,与中国电子商会官网的立场无关。如有任何疑问或了解更多,请与我们联系。电话:4008 900 668 邮箱:service@cecc.org.cn

中国电子商会 China Electronics Chamber of Commerce
京ICP备13044805号
电话:010-68256762  E-mail:service@cecc.org.cn
Copyright CECC.org.cn All rights reserved
地址:北京市亦庄经济技术开发区博兴六路17号院1号楼3层

京公网安备 11011502005504号