字节跳动开源大模型训练框架veGiantModel

林月
2022-03-17 17:59

3月17日消息,据IT之家消息,近日,字节跳动应用机器学习团队开源了一款名为veGiantModel的大模型训练框架,主要应用于自然语言处理领域的大模型训练,最高可将大模型训练的性能提升6.9倍,大幅降低训练系统的压力。

目前,字节跳动旗下的企业级技术服务平台火山引擎已在其机器学习平台上原生支持了该框架,该平台正在公测中。

format-jpg

据了解,自然语言处理是人工智能研究的一个重要领域,旨在帮助计算机理解、解释和运用人类语言,可应用于机器翻译、个性化推荐和信息提取等领域。

些年,自然语言处理在应用方面取得了较为显著的突破,主要归功于深度学习以及相关技术的发展,尤其是Bert、GPT、GPT-3等大规模预训练语言模型的普及。

针对现有训练系统在大模型训练场景下的显存压力、计算压力和通信压力挑战,字节跳动应用机器学习团队提出了大模型训练框架veGiantModel。大规模训练模型可以包含更多数据,表示更多信息,算法表现更加出众。

format-jpg

与主流开源训练框架的对比测试显示,veGiantModel的性能表现最好、受网络带宽影响最小,在Tesla V100上较Megatron、DeepSpeed有1.2倍到3.5倍的提升,在Ampere A100上最高可提升6.9倍。

据报道,近年来,字节跳动持续推动技术开源。2021年,字节跳动技术团队陆续开源了微服务中间件CloudWeGo、LightSeq训练加速引擎等30余个重要项目。

字节跳动相关技术负责人表示,推广科技创新成果的应用并推行技术开源一直是公司所倡导的,技术团队将持续通过科技创新为行业发展提供更多动力,助力科技更好地造福社会。

format-jpg

1、该内容为作者独立观点,不代表观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
2月9日消息,《科创板日报》获悉,字节跳动人工智能实验室 有开展类似ChatGPT和AIGC的相关研发,未来或为PICO提供技术支持。对此,PICO方面负责人回应称,此消息不实,PICO目前没有采用类似ChatGPT技术的产品规划。公开资料显示,字节AI Lab成立于2016年,其主要研究重点是开发为字节跳动内容平台服务的创新技术,研究领域主要涉及自然语言处理、数据挖掘、机器学习、语音与音频等。
2月9日消息,《科创板日报》获悉,字节跳动人工智能实验室 有开展类似ChatGPT和AIGC的相关研发,未来或为PICO提供技术支持。据知情人士透露,PICO目前的业务发展不及预期,为此字节AI Lab将在VR内容生成上开展更多探索。据悉,字节AI Lab成立于2016年,研究领域主要涉及自然语言处理、数据挖掘、机器学习、语音与音频等。
10月11日消息,据Tech星球报道,字节跳动的视觉技术负责人王长虎已于近期离职。据悉,王长虎于2017年加入字节跳动人工智能实验室,任科学家、技术总监。其主要研究方向包括计算机视觉、视频理解、多媒体检索和机器学习等。今年1月,王长虎担任字节跳动的视觉技术负责人。视觉技术团队的业务包含:通用与垂直业务的多模态内容理解、内容生态、热点理解与挖掘等。
3月19日,埃睿迪信息技术(北京)有限公司获75.37万元投资,投资方是字节跳动全资持股的北京量子跃动科技有限公司。
8月27日消息,零犀 科技有限公司发生投资人变更,新增北京量子跃动科技有限公司,持股比例为10%。北京量子跃动科技有限公司由字节跳动全资控股,张一鸣为最终收益人。零犀科技成立于2018年4月4日,经营范围包括技术开发、技术推广、软件开发等。其致力于AI技术商业化,核心产品为摩西智能交互大脑。
字节跳动 AI Lab(人工智能实验室)位于北京、上海、美国加利福尼亚州 mountain view三地的团队正在招揽医药领域人才。
8月18日消息,字节跳动旗下LLM人工智能机器人“豆包”现已开始小范围邀请测试,用户可通过手机号、抖音或者Apple ID登录。据了解,“豆包”是字节跳动公司基于云雀模型开发的AI工具,提供聊天机器人、写作助手以及英语学习助手等功能。“豆包”软件及相关服务系由北京春田知韵科技有限公司开发并运营,天眼查资料显示,该公司由字节旗下的北京抖音信息有限公司100%控股。
12月18日消息,字节跳动副总裁兼人工智能实验室负责人马维英表示,抖音定位全新一代社交媒体,团队在其产品上开发了很多AI技术,用以辅助内容创作,如人脸识别技术及应用、人体关键点检测与跟踪技术及应用、特效和手势识别技术及应用。另外,马维英透露,抖音在农历新年将加入更多的手势识别应用。
TikTok母公司字节跳动和微软合作开展一个被称为KubeRay的人工智能项目,该项目旨在帮助企业更有效地管理和运行人工智能应用程序。
马维英于2017年2月加入字节跳动人工智能实验室。此前,他还曾任微软亚洲研究院常务副院长。
    Baidu
    map