度小满CTO许冬亮:金融行业是大模型落地应用的高潜场景

周兴
2023-08-25 04:30

8月25日消息,在“北大光华-度小满金融大模型技术与应用论坛”上,度小满CTO许冬亮表示,金融行业是高价值行业,数字化基础好,高度依赖数据和技术,也是大模型落地应用的高潜场景。

现阶段,如何在金融领域发挥大模型的能力,许冬亮认为还有三个挑战需要解决:第一个挑战是通用模型能力不能满足金融场景需要。首先是通用大模型本身精度不够,当前大模型原生的幻觉问题、可控性问题和可解释性问题都限制了生成内容的准确性和可控性,而金融又是一个对精准性、可控性要求很高的行业;其次是通用大模型金融知识的缺失;再次是大模型更新迭代困难,金融是高时效的,模型必须能够实时跟踪金融市场的变化和趋势。

format-jpg

图注:度小满CTO许冬亮

(图源度小满官方公众号)

第二个挑战是大模型如何高效植入现有业务场景。一个团队既要懂业务场景的know-how,又要理解大模型的使用方法,而且还需要具备比较强的工程能力,这样才有可能选择出适合应用大模型的场景,高效的将大模型嵌入到实际业务流程。

第三个挑战是大模型应用于金融业中产生的安全合规和隐私保护问题。金融本身是一个高合规要求的行业,大模型又是具有颠覆性的新技术,我们对它的风险还没有完全了解,随着大模型落地的不断推进,如何平衡大模型落地收益和潜在合规风险,会是一个越来越突出的问题。

format-jpg

(图源度小满官网截图)

如何解决大模型在金融行业落地应用的这些难题,许冬亮认为每家机构独立去解决这些问题既是不现实的,也是不经济的,科技公司和金融机构在金融大模型上的合作非常有必要。

大模型训练需要大数据,但是金融数据非常宝贵。许冬亮具体解释,“大模型训练非常依赖底层的生产资料,也就是数据,但金融行业数据的分布实际上比较分散,通用智能化数据主要集中在科技公司手上,金融数据则分散在各个金融科技公司手上,而对于金融机构而言数据是核心竞争力也不太可能进行分享,其他还有监管、数据安全、隐私保护等因素存在,所以注定未来这个行业高质量数据的分布也会是分散的状态。”

许冬亮表示,未来从合作模式上来说,应该会是科技公司提供不同类型的通用大模型,金融科技公司在通用大模型的基础上提供金融行业大模型,将领域内的知识、know-how进一步整合,以私有化的形式部署到金融机构内部,而不是以云端API的方式提供服务,科技公司和金融机构未来会是深度合作的模式。

format-jpg

图注:度小满数据智能部总经理杨青

(图源度小满官方公众号)

度小满数据智能部总经理杨青透露,度小满轩辕大模型2.0版本将在10月份发布。2.0版本在对话和金融理解等场景下的能力大幅提升。在增量预训练和指令微调阶段,该版本加入了海量金融数据,对金融问题回答更加专业、准确;在对话能力上,“轩辕2.0”的上下文长度扩充至8k,能够处理更长的金融报告、研究和分析。

今年5月份,度小满开源了国内首个千亿级中文金融大模型“轩辕”。

1、该内容为作者独立观点,不代表观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
CTO在7月2日参加“2023全球数字经济大会-人工智能高峰论坛”,并发表演讲
7月3日消息,2023全球数字经济大会期间,CTO指出,在数据层面,金融行业因为安全及隐私保护要求数据大多存储在本地,而通用大模型在金融能力上缺乏必要的训练数据。他认为,“行业大模型将帮助积极拥抱大模型的中小金融机构缩小与头部机构的技术差距”。
日前,开源了国内首个千亿参数金融大模型“轩辕”。
新华书店联合启动“悦读计划”公益行动,通过向乡村地区的中学和小学捐赠图书,丰富学生们的课外读物,培养课外阅读习惯。
4月23日消息,发布《2023年度环境、社会及管治 报告》。报告显示,截至2023年底,累计为超过2200万个微企业主及工商个体户授信。数据显示,自2021年到2023年,微用户借款的平均年化利率连续3年下降,2023年平均年化利率较2021年下降了1.15个百分点。
3月11日消息,宣布“轩辕”系列金融大模型新增开源6B、13B、70B三种参数12款金融大模型。这12款大模型具有“以小搏大”的实力,在用户信息分析、业务数据洞察十余种金融实际任务评测中,达到自身2倍甚至5倍参数量的模型水平。目前,”轩辕”金融大模型已经应用在各个业务场景,从营销、客服、风控、办公再到研发,已经初见成效。
天眼查信息显示,近日,北京征信有限公司发生工商变更,注册资本由100万人民币增至1亿人民币。
    Baidu
    map