阿里达摩院公开“图像中的文本识别方法、装置”专利

云合
2022-03-18 11:50

3月18日消息,天眼查资料显示,阿里巴巴达摩院(杭州)科技有限公司3月18日公开一项“图像中的文本识别方法、装置、设备及存储介质”专利,申请公布号为CN114202647A,申请日期为2022年2月16日。

format-jpg

该专利摘要显示,本公开涉及一种图像中的文本识别方法、装置、设备及存储介质。本公开通过获取目标图像,并确定该目标图像中包含至少一行文本的子图像。进一步,将所述子图像、以及所述至少一行文本中的每个字符输入多模态模型,由于子图像含有较为直观且准确的信息,从而使得多模态模型的输入中增加了原始视觉信息,使得多模态模型可以根据子图像对文本标注任务进行增强和指导,从而使得多模态模型可以确定出每个字符较为准确的标签。

进一步,根据每个字符的标签可以对该至少一行文本进行准确的断句,尤其是对有歧义的文本行的断句处理效果较好,避免将图像中的多段文本识别为一段文本,以及避免后续的文本理解或处理出错。

format-jpg

format-jpg

近日,阿里巴巴达摩院(杭州)科技有限公司还公开“测试器件以及采用测试器件进行测试的测试方法”、“主题词确定方法、设备及存储介质”、“文本识别方法、图像矫正方法、电子设备和存储介质”等多项专利。

天眼查资料显示,阿里巴巴达摩院(杭州)科技有限公司成立于2017年11月7日,法定代表人为周明,注册资本1000万人民币,经营范围包括:技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;软件开发;专业设计服务;翻译服务(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)。

format-jpg

股权穿透图显示,阿里巴巴达摩院(杭州)科技有限公司由阿里巴巴(中国)有限公司全资持股,认缴金额1000万人民币。

format-jpg

1、该内容为作者独立观点,不代表观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
3月30日消息,天眼查信息显示,阿里巴巴达摩院 科技有限公司日前公开一项“障碍物检测系统、避方法、电子设备及存储介质”专利,申请公布号为CN114255400A,申请日期为2021年12月14日。该障碍检测系统包括图像采集装置、红外测距传感器和控制器。该系统可以准确地检测障碍物,以方便实现避
阿里巴巴达摩院1月25日公开一项“图像分类方法、计算机终端及存储介质”专利
阿里巴巴达摩院公开一项“图像生成方法、设备及存储介质”专利
阿里巴巴达摩院(杭州)科技有限公司公开一项“图像分割模型训练、图像分割方法及装置”专利
阿里巴巴达摩院公开一项“文本识别方法、图像矫正方法、电子设备和存储介质”专利
此次免费开放100件AI专利许可,覆盖了图像技术、视频技术、3D视觉等诸多AI技术领域。
阿里巴巴达摩院(杭州)科技有限公司公开一项“图片处理方法、装置、电子设备及计算机存储介质”专利
6月13日消息,天眼查APP显示,近日,阿里巴巴达摩院 科技有限公司“声纹特征提取方法、说话人识别方法、模型训练方法及装置”专利公开。专利摘要显示,主要技术方案包括:获取包含语音音频;提取音频频谱特征输入声纹提取模型。本申请能够提升声纹特征提取准确性。
    Baidu
    map