达摩院推出新型预训练对话模型 首次利用半监督学习注入知识

宋妤
2022-04-12 16:43

4月12日消息,据天下网商消息,今日,阿里达摩院研究人员首次利用半监督学习将标注的人类知识注入预训练对话模型,在MultiWOZ2.1等三个国际主流对话数据集中均实现了最佳效果,为知识和数据融合探索出新路径。

format-jpg

(融合知识后,AI会进行思考)

据了解,一个模型只能解决一项任务,通用性差是AI的一大问题。而预训练模型可能是破解之道,因此近些年备受关注,已迅速发展出万亿参数的大模型。不少研究者认为,数据量只是一方面,如果能将人类知识有机注入预训练模型, AI有望像人类一样思考。

但知识注入并不容易,简单混合容易导致知识被淹没,或者出现严重的过拟合。达摩院研究人员此次利用半监督学习来对预训练对话模型注入知识,在人机对话领域尚属首次。

format-jpg

(图为半监督使用示意图)

据介绍,预训练对话模型有别于常见的预训练语言模型,需更多考虑对话轮次、上下文情境、对话人员的角色等,以便理解对方意图并做出恰当回复。也就是说,这类模型必须考虑对话过程中的策略,他们属于特定场景下的人类知识。业界通常用对话动作标签(dialog act)来刻画对话策略,比如模糊澄清、信息问询和信息告知等。

为此,达摩院研究人员构建了目前最大的对话动作标签知识库,总量达97万轮次,将其注入新设计的预训练对话模型SPACE 1.0中,随后在下游任务进行验证。新模型在斯坦福 In-Car,剑桥MultiWOZ2.0和亚马逊 MultiWOZ2.1这三个国际主流对话数据集上均实现了SOTA(最佳效果),部分提升超过5%,幅度较大。在具体案例中,新模型能够更准确预测出对话动作,能够更好和人类进行对话,避免答非所问。

format-jpg

(图为达摩院新模型在三大国际数据集上的表现)

值得一提的是,在AI应用方面,此前,全国特大型钢企南京钢铁上线了AI质检系统,借助阿里达摩院先进算法,钢板表面缺陷检出率从原来人工的90%提升至98%,钢板出厂质量明显提升,质量异议金额从0.06元/吨降至0.02元/吨。

1、该内容为作者独立观点,不代表观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
阿里巴巴周三宣布成立“达摩院”,未来3年在研发方面投入1000亿元,平均每年50亿美元。美国科技媒体ReCode撰文称,阿里巴巴此举旨在加强与亚马逊和谷歌等美国科技巨头的竞争。不过,尽管这意味着阿里巴巴每年的研发投入将在上财年25亿美元的基础上增加一倍,但仍远远落在美国科技巨头后面。其最明显的竞争对手亚马逊公司上财年研发投资达161亿美元,高居全球首位,而阿里巴巴的投资还不
旺季在即,侵权的坑不要踩。
每逢旺季,卖家往往就要遭遇物流难题。
“AI+跨境电商”的组合拥有光明的未来。
该工具旨在帮助第三方卖家快速解决其账户问题并获取销售和库存数据,已面向首批美国卖家推出测试版。
亚马逊在印度德里首都区、古瓦哈提和巴特那开设三个新的配送中心,显著提高印度北部和东部地区的物流配送速度。
9月20日消息,为迎接即将到来的节日季,亚马逊印度宣布在德里首都区、古瓦哈提和巴特那开设三个新的配送中心。这一举措将显著提高印度北部和东部地区的物流配送速度,帮助本地卖家更好地服务顾客,并创造数千个新的就业机会,进一步促进印度经济发展。新的配送中心都已准备就绪并投入使用,预计将为德里首都区、比哈尔邦和阿萨姆邦超过25万名卖家提供物流支持。
9月20日消息,亚马逊周四宣布推出一款新的人工智能应用程序,将帮助其独立卖家完成销售指标管理、库存维护和产品广告等工作。这款名为Amelia的软件可以即时回答一些广泛的问题,比如如何为假期做准备、卖家的业务表现如何。亚马逊负责全球销售合作伙伴服务的副总裁Dharmesh Mehta表示,Amelia旨在为卖家提供“个性化的亚马逊销售专家”服务。
巨头的风采,不减当年啊。
    Baidu
    map