现代计算机之父阿兰·图灵1950 年在哲学刊物《思维》上发表了“计算机器与智能”一文,提出了经典的图灵测试,在测试者与被测试者( 一个人和一台机器) 隔开情况下,通过一些装置,如键盘,向被测试者随意提问。 进行多次测试后,如果有超过 30% 的测试者不能确定被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。 由此可见,人机对话技术在人工智能领域的重要性。
按照对话系统的技术架构来分,人机对话系统可以分为任务型对话系统和非任务型对话系统两大类,在实际商业应用中这 2 种对话方式常常结合在一起使用。 任务型对话通过交互的方式帮助用户完成一项或多项特定的任务,如智能订票系统、账单查询系统等。非任务型对话系统没有明确的任务列表,可以用于同用户闲聊,或回答用户在某一个或多个领域的问题。
随着深度学习、强化学习等基础算法的快速发展,人机对话系统的总体架构、算法体系以及应用模式都有了重大的改变和提升。
无论从学术界还是工业界的角度看,当前的人机对话系统仍然存在很多问题和挑战。
(1)语义表征。人类的语言代表了文明。在人机对话系统中的自然语言表达具有多样性、歧义、口语化等多种特征,如何更加合理地将对话中的自然语 言、上下文历史等相关信息用机器表征,从而让系统 能更好地理解是有待研究的问题。
(2)逻辑性。对话过程中的逻辑性是人与人交谈过程中的显著特征。 如何让机器在开放域能够具备这个能力,目前仍然存在比较多的困难和问题。通过借助知识图谱和知识嵌入的方式,让机器在一 定程度上能够进行引用推理和逻辑判断,但是跨领域、跨行业模型的迁移和泛化仍然是目前的一个研 究热点。
(3)一致性。 用户在和机器的交互过程中,往往具有鲜明的个性化特点,不同用户的表达方式、行为习惯、个人属性等方面都存在差异。 如何让机器首先具备个性化特点,并且在人机交互的过程中,具备表达内容的前后一致性,未来可以通过对抗学习、元学习等模型和技术进行优化。
(4)交互性。 当前的对话系统还是以被动回答为主。 在真实的对话场景中,良好的对话情形往往是由双方共同把控。 主动对话和话题引导、话题的开启和结束等能力,需要机器能够更好地和外部资源、服务等连通,多智能体之间需要进行多任务训练 和学习。
更好地交互体验需要多模态( 语音、语言、 视觉、情 感 等) 的共同作用,这也是未来的趋势之一。 更加友好的产品用户体验、更加标准化的对话系统组件、更加高效的模型训练与部署、更加合理的系统评价方式和更加自主的学习更新能力是对话系统在工业界实用产品化面临的几大难点。
人工智能技术飞速发展的今天,它给人类带来生活便利的同时,一些安全和隐私方面的问题也随之产生。 如何让人工智能技术充满温度,更加人性化地服务于行业和社会,符合纲常伦理、公序良俗的创造将是所面临的更大挑战。
参考文献:《智能对话系统架构及算法》
转载本文须保留本网站注明的“来源/参考文献+中国煤炭行业知识服务平台”,侵权必究。
主办单位:煤炭科学研究总院有限公司 中国煤炭学会学术期刊工作委员会