阿里达摩院公开“文本数据处理方法、设备”专利

云合
2022-04-08 11:55

4月8日消息,天眼查资料显示,阿里巴巴达摩院(杭州)科技有限公司4月8日公开一项“文本数据处理方法、设备和存储介质”专利,申请公布号为CN114297378A,申请日期为2021年12月6日。

format-jpg

该专利摘要显示,本发明实施例提供一种文本数据处理方法、设备和存储介质,该方法包括:先利用特征提取模型提取训练文本的第一文章向量,再根据第一文章向量和来源信息训练分类模型。之后,根据分类模型输出的分类结果,调整特征提取模型的模型参数,从而实现特征提取模型的预训练。接着,根据调整后的特征提取模型提取训练文本的第二文章向量,再根据第二文章向量和训练文本的评价信息训练评价模型。

通过对特征提取模型的预训练,能够提升特征提取模型的特征提取能力,使其能够提取出包含训练文本的语义信息和来源信息的第二文章向量,再借助此信息丰富的第二文章向量训练评价模型,也能够提升评价模型的训练效果,保证评价模型对文本数据评价的准确性。

format-jpg

format-jpg

近日,阿里巴巴达摩院(杭州)科技有限公司还公开“文本比对方法、电子设备、存储介质及程序产品”、“障碍物检测系统、避障方法、电子设备及存储介质”、“神经网络结构搜索方法、装置、电子设备及存储介质”等多项专利。

天眼查资料显示,阿里巴巴达摩院(杭州)科技有限公司成立于2017年11月7日,法定代表人为周明,注册资本1000万人民币,经营范围包括:技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;软件开发;专业设计服务;翻译服务(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)。

format-jpg

股权穿透图显示,阿里巴巴达摩院(杭州)科技有限公司由阿里巴巴(中国)有限公司全资持股,认缴金额1000万人民币。

format-jpg

1、该内容为作者独立观点,不代表观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
阿里巴巴达摩院3月22日公开一项“文本合并方法、装置、设备及存储介质”专利
阿里巴巴达摩院公开一项“文本识别方法、图像矫正方法、电子设备和存储介质”专利
阿里巴巴达摩院公开一项“评论文本的情感信息提取方法、装置、计算机设备和介质”专利
阿里巴巴达摩院公开一项“逆文本标准化方法和装置”专利
阿里巴巴达摩院3月25日公开一项“视频文本识别方法、装置、电子设备及可读存储介质”专利
阿里巴巴达摩院3月18日公开一项“图像中的文本识别方法、装置、设备及存储介质”专利
6月13日消息,天眼查APP显示,近日,阿里巴巴达摩院 科技有限公司“声纹特征提取方法、说话人识别方法、模型训练方法及装置”专利公开。专利摘要显示,主要技术方案包括:获取包含语音的音频段;提取音频段的频谱特征输入声纹提取模型。本申请能够提升声纹特征提取的准确性。
此次免费开放100件AI专利许可,覆盖了图像技术、视频技术、3D视觉等诸多AI技术领域。
阿里巴巴达摩院近日公开一项“机器客服训练系统及其方法、语音回复方法和电子设备”专利
    Baidu
    map