字节大语言模型研发技术专家杨红霞离职创业

刘峰
2024-05-24 11:36

5月24日消息,据36氪,从多个独立信源处获悉,字节跳动大语言模型研发技术专家杨红霞已于近日从字节跳动离职,并开始筹备AI创业项目。截至发稿前,字节跳动并未回应上述消息。公开资料显示,杨红霞毕业于南开大学、杜克大学统计科学系,师从著名统计学家David Dunson。她在人工智能领域国际会议、顶级期刊有近百篇顶级论文。

format-jpg

图源:36氪

2023年,阿里M6大模型的前带头人杨红霞加入字节AI Lab(人工智能实验室),参与语言生成大模型的研发。此前,杨红霞曾是阿里达摩院超大规模多模态预训练模型M6的技术负责人。2022年9月,杨红霞因个人家庭原因离开了达摩院。

据了解,杨红霞曾带领M6大模型从百亿级进化到千亿、再到万亿的参数量,并且主导认知智能技术的发展和场景落地。2021年3月,M6大模型首次发布,到2021年底阿里云发布M6最新进展时,其参数已至10万亿,成为当时全球最大的AI预训练模型。

加入字节后,杨红霞进入字节AML(Applied Machine Learning,机器学习系统)团队,汇报给字节跳动AML和豆包大模型Foundation团队负责人项亮,在美国西雅图带队大语言模型的研发。

format-jpg

图源:AI TIME 论道公众号

值得一提的是,近日,字节跳动在2024春季火山引擎Force原动力大会上宣布,字节豆包大模型正式开启对外服务。豆包大模型目前包含豆包通用模型Pro、豆包通用模型liti、豆包·角色扮演模型、豆包·语音合成模型、豆包·声音复刻模型、豆包·语音识别模型、豆包·文生图模型、豆包·Function Call模型。

字节产品和战略副总裁朱骏同时宣布,豆包APP总下载量已达1亿次,将正式开启付费商业化模式,提供更多高级功能和服务。

价格方面,火山引擎总裁谭待表示,豆包APP的价格相比同行便宜99.3%,在企业市场的定价0.0008元/千Tokens,仅需0.8厘就能处理1500多个汉字。大模型的“token”是指在自然语言处理任务中,模型所使用的输入数据的最小单元,这些token可以是单词、子词或字符等。

format-jpg

图源:新浪科技

1、该内容为作者独立观点,不代表观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
知情人士表示,红霞在语言生成模型团队中处于领导地位,直接向字节跳动副总裁震原汇报。
3月22日消息,36氪获悉,阿里M6模型的前带头人红霞已加入字节AI Lab ,参与语言生成模型的研发。一名知情人士表示,红霞在语言生成模型团队中处于领导地位,直接向字节跳动副总裁震原汇报。36氪就上述消息向字节跳动求证,截至发稿前暂未收到回复。2022年9月初,红霞因个人家庭原因从阿里巴巴达摩院离职。M6是阿里巴巴达摩院研发的超大规模多模态预训练模型,而模型是本轮AI浪潮中的竞争核心。
7月20日消息,今日,火山引擎原动力大会在京举办。会上,字节跳动副总裁震原以抖音电商为例,分享了火山引擎是如何支持公司内部业务做好数据驱动的。
11月29日消息,字节跳动扶贫总经理洁今日宣布,正式启动“山里DOU是好风光”项目,将以抖音为主要平台,从流量倾斜、人才培训、产品功能和抖音官方认证等四个方面实现精准扶贫。洁认为,抖音短视频正成为文旅扶贫的新抓手。《抖音县域景点数据报告》显示:抖音最热门的一百个县域景点中,约三成位于贫困县;抖音上最热门的十个县中,有四个是贫困县。
火山引擎发布自DPU等系列云产品,震原以《抖音的机器学习实践》为主题,分享了他对机器学习的理解。
3月26日消息,天眼查数据显示,泰川禾文化传媒徐州有限公司新增股东——北京量子跃动科技有限公司。北京量子跃动为字节跳动有限公司全资控股子公司。泰川禾的法定代表人铭是papitube的联合创始人,也曾是艺人Angelababy、周冬雨的经纪人。
7月30日消息,天眼查信息显示,近日,持牌支付机构武汉合众易宝科技有限公司 发生多项工商变更,法定代表人从振宇变更为王睿。振宇作为执行董事从主要人员中退出,监事艾合坦木江·艾合买提退出,总经理何玉龙退出。合众支付成立于2012年,注册资本金1.5亿元人民币,经营范围含非银行支付业务;互联网信息服务;货物进出口等。
8月31日,字节跳动旗下硬件业务大力智能团队小范围宣布,原Musical.ly创始人陆育不再负责大力智能业务。
    Baidu
    map