阿里巴巴达摩院发布中文社区首个表格预训练模型SDCUP

宋妤
2021-12-02 16:28

12月2日消息,据天下网商消息,今天,阿里巴巴达摩院深度语言模型体系AliceMind发布中文社区首个表格预训练模型SDCUP,该模型在全球权威表格数据集WikiSQL、SQuALL上取得了业界最优效果,且模型和训练代码均已对外开源。

format-jpg

据介绍,表格是应用普遍的结构化数据,也是智能对话系统和搜索引擎的重要答案来源。新兴的表格问答技术,可将自然语言转换为查询语句,使用户能通过简单问句直接与表格数据库交互,具有广泛应用前景。

本次,达摩院对话智能团队提出了首个中文表格预训练模型SDCUP,其基于“模式依存”方法,通过模型直接预测自然语言与表格结构内容的关键词映射,提升了表格问答的准确率。

format-jpg

据达摩院资深算法专家李永彬介绍,SDCUP模型是达摩院表格对话技术系列研发的一部分,后续将持续对外开源。其相关技术先后在四大国际公开数据集WikiSQL、Spider、SParC、CoSQL上取得第一。

值得注意的是,目前,该技术完成了产品化,已通过阿里云智能客服为政务、金融、零售等行业客户提供表格问答和数据库自然交互服务。

format-jpg

值得一提的是,近来阿里巴巴达摩院在新产品研究方面取得了许多成果。10月下旬,在杭州云栖大会上,阿里巴巴达摩院发布软硬件结合语音产品“听悟”。

据介绍,相比只能逐字转写的上一代语音产品,“听悟”是面向未来会议的AI助理,其集成了达摩院最新语音及自然语言处理技术,不仅“听”得准,且“悟”性高,可秒速生成智能会议纪要及待办。

1、该内容为作者独立观点,不代表观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
阿里巴巴达摩院6月17日公开一项“基于表格数据的人机交互方法、装置及设备”专利。
1月12日消息,阿里巴巴达摩院发布2023十大科技趋势预测,涵盖人工智能、计算等领域的前沿科技。达摩院预计,这些技术将加速突破,并于经济和社会方面对各核心产业产生积极影响。其中,备受关注的生成式AI预计将进一步发展,不断拓宽应用边界并将为数字化内容的制作方式带来变革。生成式AI是利用现有文本、图像或音频文件创建新内容的技术。目前,生成式AI通常被用来生成产品原型及初稿,应用场景涵盖游戏、广告、平面设计等。
12月22日消息,阿里官微披露,12月22日,阿里巴巴达摩院发布新一代语音识别模型Paraformer,这是业界首个应用落地的非自回归端到端语音识别模型。目前,该模型于魔搭社区面向全社会开源,适用语音输入法、智能客服、车载导航、会议纪要等众多场景。
今日,阿里巴巴达摩院发布新型联邦学习框架FederatedScope,该框架支持大规模、高效率的联邦学习异步训练,能兼容不同设备运行环境,且提供丰富功能模块。
1月25日消息,昨日,在 “中国工程院院刊:信息领域青年学术前沿论坛”上,阿里巴巴达摩院、上海浙江大学高等研究院、上海人工智能实验室联合发布“洛犀”端协同平台。该平台提供一站式的端协同模型训练、部署、通信能力,致力于促进大小模型协同进化,构建充分利用大模型应用潜力的新一代人工智能体系。
今日,阿里巴巴达摩院发布2022十大科技趋势,这是达摩院连续第四年发布前沿科技趋势预测。
昨日,在杭州栖大会上,阿里巴巴达摩院发布软硬件结合语音产品“听悟”。
    Baidu
    map