玄武科技杨登峰:人工智能的未来是模块化
杨登峰是国内知名人工智能专家,近日其受邀担任南京大学人工智能特聘教授,我们有幸采访到杨教授就人工智能的热点话题分享了他的观点。
问:首先能否谈谈您受邀为南京大学特聘教授的感受?
答:首先感谢南京大学的邀请,我跟高校合作不是第一次,2009年曾在上海交通大学当过一年多的讲师,教授App编程的课程,那段经历至今仍让我记忆犹新。南京大学是我国著名学府,我一直怀有极高的敬意。南京大学不仅在学术上处于前沿,还创造性的联合部分科技企业,携手打造人工智能领域的协同科技创新平台,是产学研型生态创新的引领者,能够加入这样一个高水平的创新平台,对我而言既是荣耀更是责任。
问:您能简要分享一下在人工智能领域的经历吗?
答:早在20年前我便从事于人工智能研究。2006年在Fix8公司从事人脸表情分析和重组技术的研究,当时实现了在PC端实时识别并传输人脸表情至诺基亚N95手机上的突破性成果。
2013年,创办了音乐识别与纠正的技术项目,尽管该项目技术超前,但涉及的多音频检测技术至今仍无成熟解决方案,我的团队一直没有放弃,始终与全球顶尖的专家学者保持密切合作,探索更理想的技术解决方案。
2016年,创办了小A机器人电话智能应答系统,这个项目不仅是国内最早的电话机器人解决方案之一,还涵盖了智能信息推理、训练系统和人工智能网络安全等多项前沿技术,至今成功获得了三项发明专利。
问:作为南京大学特聘教授,您有什么建议给到想学习人工智能的学生们?
答:数学、逻辑学、计算机科学等对学习人工智能都很重要,这将为将来研究AI算法打下坚实基础。另外实践对于人工智能学习而言更加重要,南京大学的学生基础都是很好的,因此我建议大家更多地参与实际项目,特别是开源社区的项目实践。理论与实践结合,将使学生在未来的人工智能算法研究中占据有利位置。
问:目前人工智能研究的热点有哪些?能给广大学生们普及一下吗?
答:人工智能是非常广的一个概率,我这里就简要介绍一下。多媒体的形式有文本、声音、图片和视频,人工智能之前的快速发展,关于文本和声音的处理相对比较成熟;关于文本的推理系统,关于语音识别和语音合成都有着广泛的应用。
对于图片的AIGC解决方案,主流的解决方案很多,比如:Midjourney,DeepMind,OpenAI的DALL.E等。近年来短视频场景热度很高,文生视频解决方案一直收到追捧,比如Sora、RunwayML和Pika等。国内也有一些相关的项目非常出色,比如快手之前开源的LivePortrait项目,在克隆表情方便的表现就很优秀。
问:作为一个人工智能的专业人士,您如何看待人工智能统治人类的担忧?
答:自我意识觉醒需要个体能够认识到自己的存在、有自己的思考,对环境有感知能力;而在人工智能领域计算机能否对自身状态进行内省和有意识的反思是一个重要指标。当前人工智能技术主要还是基于特定算法来执行任务,比如大模型算法,尚不涉及自我意识范畴。
人工智能统治人类更多是科幻作品的情节,与现实技术有较大的差距。当然我们应该未雨绸缪,重视人工智能可能存在的风险,目前行业规避风险的方式主要是通过同行评价的方式。比如Hugging Face提供的开源Transformers库,GitHub提供代码仓库,arXiv公布技术论文等。所有人都可去了解相关实现的原理和实现细节,大家一起去评估隐藏的风险,从而避免风险。
问:如何看待人工智能的治理?
答:我觉得人工智能的治理应通过标准化来实现。相关的标准应该涵盖伦理、数据规范、技术实现、测评指标和隐私保护等方方面面。
目前国家信标委人工智能分委会正在加班加点的建设人工智能的国家标准库。我个人有幸参与了大模型国家标准的制定工作,这是一个责任重大且充满挑战的过程,需要考虑的不仅是技术的前沿性,更要确保人工智能大模型的透明性、安全性和公平性。我主要负责评估指标的建立,特别是在如何有效避免算法偏见方面下了很多功夫。这是一个需要与行业多方协作的过程,确保标准的合理性与前瞻性对行业未来的发展至关重要。
问:您如何从技术层面看待未来的人工智能?
答:未来不同的算法会根据不同的应用场景被开发成模块,模块之间可灵活组合。这种集成方式能加速新技术的实验和推广。通过模块化设计,系统的复杂度得以控制。这种方式降低了系统的故障风险,提高了可靠性和稳定性。
模块化设计也方便了标准化,标准可以针对每个模块进行定义,这为系统间的兼容性提供了保障。模块化能够推动不同厂商或开发团队协作,使得AI技术的应用在全球范围内更加统一和兼容。
不同的技术或算法可以被开发成模块,这些模块可以根据不同的应用场景或需求进行灵活组合。这种集成方式能加速新技术的实验和推广。
随着人工智能技术的发展,需求会不断增长。模块化使得系统更具可扩展性,可以方便地增加新功能模块或升级已有模块。未来在模块化设计的前提下,自动驾驶模块,感知模块、决策模块和执行模块均灵活的组合。
至于个体如何适应人工智能,著名未来学家,《失控》作者凯文·凯利(Kevin Kelly)前两天在外滩大会上的观点很有借鉴意义:当答案变得唾手可得,真正有价值的是提出正确问题的能力。