[导读] 在近日于深圳举办的2018中国人工智能大会上,AI领域的顶级大牛、南京大学人工智能学院院长、ACM/AAAI/IEEE Fellow周志华发表了演讲,并在会后接受了网易智能等媒体的采访,不仅对其最新研究的深度森林模型进行了详细的阐述,还透露了南京大学新成立的AI学院招生情况和人才培养计划。
“机器学习是智能化时代的关键,它将赋予这个时代‘芯’和‘魂’”。”
在近日于深圳举办的2018中国人工智能大会上,周志华教授这样表述机器学习在新时代的重要性。他呼吁国内关注研发新的机器学习模型算法、芯片和平台,以避免未来在AI领域造成GPU、TensorFlow等国外平台独大的局面,再次酿出第二个“中兴事件”。
研发首个非神经网络模型“深度森林”
第三波人工智能浪潮兴起之后,深度学习技术大火,深度神经网络模型成为产业界和学界追捧的对象。但是,目前的深度神经网络也有诸多缺陷,比如太多超参数、需要大量训练数据、理论分析难、黑箱模型,以及模型一旦选定复杂度即确定,通常远大于任务“所需”复杂度等等问题。
正因为如此,周志华教授开始了非神经网络模型“深度森林”的研究。他向网易智能介绍,“深度森林”并不是要替代深度学习,它本身就是一种深度学习,是首个不使用BP算法来训练的深度学习模型,这本身在学术上很值得探索。
另外,从应用价值的角度讲,周志华表示,在图像、视频、语音之外的很多任务上,深度神经网络往往并非最佳选择,不少时候甚至表现不佳,比如符号建模、混合建模、离散建模等问题上。“深度森林”在这些任务上可能有更好的表现。目前,深度森林模型已经有大型企业应用并取得了很好的效果。
周志华表示,对于“深度森林”的研究才刚刚开始,“创新技术从新生萌芽到发展成熟往往要经过长期探索、积累,甚至曲折反复。”周志华称,深度神经网络经过二十多年无数研究者添砖加瓦才有今天的成效,“深度森林”还有很长的路要走。GPU、TensorFlow等都是基于深度神经网络的芯片和平台,研发非神经网络的深度学习模型有助于降低被垄断的风险。
南大AI学院本科生9月入学,分两个专业方向
在人才培养方面,南京大学在今年3月正式设立人工智能学院,由周志华负责领导和建设。
周志华向网易智能透露,南京大学人工智能学院今年已经开始招生,第一批本科生招生规模80人,其中70人从高考填报志愿的考生中选拔,10人通过综合评价选拔,这些学生将于9月入学。周志华还透露,目前这批本科的生源质量非常好,有很多高分考生报考南京大学人工智能学院。
据悉,目前南大AI学院入学的本科生有两个方向,一个是机器学习与数据挖掘,一个是智能系统与应用。周志华表示,未来可能会根据学院发展增设新的方向。
至于硕士和博士招生方面,周志华称将面向全国进行招生,硕士研究生和博士研究生将于2019年9月入学。在师资方面,周志华称学院将持续面向海内外公开招聘高水平教师。
AI学科需要新的人才培养体系
对于南大AI学院即将入学的第一批学生,周志华表示将采用全新的人才培养机制。
周志华透露,南京大学在两年前已经开始酝酿人工智能学生培养体系,不仅在课程设置上是全新的,而且非常重视基本功、重视实践,今年9月份入学的本科新生就会进入新的培养体系。
据悉,周志华所说的新的培养体系,其中很重要的一点是学院与大型企业合作来给学生创造更好的实训条件。今年4月,京东在南京大学人工智能学院附近建立京东南京人工智能研究院,并与南京大学签订合作协议。周志华称,南大AI学院与京东的合作一方面使学生在培养过程中可以接触企业真实案例,在企业实习期间也能得到老师的指导;另一方面,京东早期介入人才培养,不仅有助于加强其人工智能人才队伍,还可望与南大人工智能学院的高水平教师合作开展研究解决问题。
这样的新探索将使得高校人才培养与业界加强互动,培养出理论与应用实践能力兼备的优秀人才。周志华透露,除了与京东合作外,目前科沃斯、旷视科技都在南京大学附近建立了研究院,与之开展学生实训合作。
以下为周志华教授对其他几个问题的回答:
问:对于想要转型学习人工智能的人来说,您有什么建议?
周志华:现在机器学习很火,很多人都在学习,虽然现在这方面的人才很缺乏,但不能保证大量人才涌入这个领域以后会不会造成人才供应过饱和问题。
如果一定想转型学习人工智能,一定要知道这几点。第一,人工智能对数学的要求比计算机学科的大部分分支要高;第二,计算机科学本身的核心专业知识必须具备;第三,与数学不一样的是,人工智能技术要解决现实问题,而且这些问题通常事先没有定义清楚,所以很重要的是对现实问题进行有效的分析和建模,理解和沟通能力非常重要。
问:您如何看待自然语言处理的发展?
周志华:最近今年,在自然语言处理上面,大家也更多的开始使用深度学习,虽然也获得了一些进步,目前最成功的是机器翻译,但机器翻译实际上并不是典型的自然语言处理任务。
综合来看,深度学习在自然语言处理上的应用没有在视频、图像、语音上那么成功,主要原因可能是现在的深度神经网络主要功用是进行表示学习,而人类自然语言是在几千年中发展的,有很多关于语法、句法、词法的知识,而这些知识不该扔掉,不能只用深度学习技术。最好是把这些知识与机器学习结合起来,但这会涉及到一个很重要的问题,就是如何把学习与推理结合,这是一个很大的技术挑战。
问:在数据驱动的人工智能时代下,您如何看待数据隐私问题,如何解决AI应用引发的一些伦理和道德问题?
周志华:任何一个技术都有它的两面,一方面我们需要探索和发展技术本身,另一方面要防止它被滥用。我们主要在关注前者,对于后者的研究也很多,例如社会学、伦理学都在关注。这就像核武器引发争议一样。这两方面的事情都很重要,需要有相关的人去思考解决。