史上最快芯片Etched Sohu到来:一张能顶20张英伟达H100

李迎
2024-06-26 21:38

初生牛犊不怕虎。

一、Etched.ai对英伟达下了战书

英伟达最近真是一波未平一波又起,刚刚才扭转了三天股价下跌4300亿美元的势头,又被行业初创公司给盯上了,可谓是打江山容易,守江山难。

6月25日,Etched.ai公司宣布已完成1.2亿美元的融资,将向Nvidia最引以为傲的AI芯片设计发起挑战。

在当今这个由数据驱动的时代,人工智能(AI)芯片无疑站在了科技革命的前沿。它是智能算法的心脏,为机器学习、图像识别、自然语言处理等提供了强大的计算支持。

在这样的大背景下,三位哈佛辍学生Robert WachenGavin UbertiChris Zhu,带着对技术的热爱和对创新的追求,投身于AI芯片行业,开启了他们的创业之旅——Etched

图片

图源:X(前Twitter)

其中,作为公司最早的两名创始人之一的Gavin Uberti,曾在OctoMLXnor.ai担任要职,积累了丰富的行业知识和经验。

而另一位华裔创始人Chris Zhu,除了在哈佛大学担任过计算机科学的教学研究员外,还有在亚马逊等公司的实习经历,这些经历让他对技术的商业应用有了深刻的理解。

丰富的科技履历加上哈佛大学做背书的顶尖学习能力,让他们有了更高的眼界和更敏锐的意识,在2022年三人就打赌Transformer大模型将统治世界。

因此,他们将所有的精力都用来打造世界上第一个针对Transformer(即ChatGPT中的T)的专用芯片——Sohu

谈到AI芯片,英伟达的名字是绕不开的话题。凭借其在图形处理单元(GPU)领域的深厚积累,英伟达在AI芯片市场占据了举足轻重的地位。

其产品不仅广泛应用于游戏和图形设计,更在AI训练和推理任务中展现出卓越的性能。

但正是这样,Etched放出的狠话,“就Transformer而言,Sohu是有史以来最快的芯片,没有任何芯片能与之匹敌”,才让他们的这次融资备受瞩目。

那么市面上有着如此多的AI模型,包括DLRM、Stable Diffusion等老牌强者,为什么Etched一定要做Transformer的专用芯片呢?

一张图片告诉你答案:

图片

图源:Etched

在Transformer发力以前,许多公司都有着自己的大模型架构,而从GPT-2诞生开始一直到今天,所有大型科技公司(OpenAI、谷歌、亚马逊、微软、Facebook等)都开始使用Transformer模型。

Transformer由谷歌研究团队于2017年提出,它的功能强大、实用且利润丰厚。

市面上耳熟能详的OpenAI 的GPT系列、谷歌的PaLM、Facebook的LLaMa,甚至Tesla的FSD都是Transformer架构。

这证明了Chris Zhu等人确实有着先见之明,也让这场“赌局”的形势似乎变得明朗起来,因此他们对英伟达发出的挑战才会得到众多业内人士的关注。

随着Etched.ai技术的不断成熟,它有望成为AI芯片行业的一股不可小觑的新兴势力,并且能为行业的发展注入了新的活力。

不过,Transformer并不是不可替代,目前依然还有SSM、RWKV等多个新架构正在被研究,Etched表示:“一旦Transformer被任何新架构取代,我们的Sohu芯片将毫无用处,但如果我们猜对了,Sohu将改变世界!”

创始人Uberti则更有信心:“发明了一种比 Transformer 更好的新架构成本非常高,并且这种情况十年内只会发生一两次,就像半导体领域发生的那样:光刻技术、掩模版/晶圆尺寸和光刻胶成分的变化确实在不断优化,但变化速度非常缓慢。

二、Sohu芯片强在哪里

要想知道Etched的信心从何而来,他们一直宣传的Sohu芯片就是关键。

在Etched看来,当前市场上流行的AI芯片,特别是英伟达的GPU,它们的芯片单位面积的计算能力 (TFLOPS) 几乎保持不变。

图片

图源:Etched

也就是说,如今的AI显卡的能力提升,靠的是物理上的堆叠,比如NVIDIA的B200AMD的MI300Intel的Gaudi 3亚马逊的Trainium2都是将两块芯片算作一张卡,来实现所谓的“双倍”性能,总给人一种力大砖飞的感觉。

Etched.ai的Sohu芯片采用了尖端的4nm工艺技术,这一工艺使得芯片在单位面积上集成了更多的晶体管,从而极大地提升了芯片的计算密度和能效比,显著降低了能耗。

并且,Sohu芯片的核心优势在于其专为Transformer模型优化的设计,在Transformer被用来处理的自然语言处理和图像识别等方面拥有传统GPU无法比拟的计算速度。

根据Etched官方发布的数据,一台8 x Sohu服务器可以取代 160 个H100 GPU,一台8 x Sohu 服务器每秒可以处理超过500,000个Llama 70B令牌。

图片

图源:Etched

与市场上的传统GPU相比,Sohu芯片展现出了其高吞吐量和低延迟特性。这些特性使得Sohu在AI模型的推理和训练任务中,拥有卓越的处理速度和能效。

这种性能上的优势,使得Sohu芯片在未来AI芯片市场中能够占据一个独特的位置,为那些寻求高性能、高效率AI解决方案的客户提供新的选择。

在这种背景下,Etched.ai被众多投资者所看好。

Primary Venture PartnersPositive Sum Ventures等知名风险投资公司领投,公司自成立以来,已经完成了几轮融资,这一次1.2亿美元的融资还吸引了包括Peter ThielGithub CEO Thomas Dohmke以及Coinbase前CTO Balaji Srinivasan在内的一系列知名天使投资者。

他们的加入进一步增强了Etched的信誉和市场影响力,也为公司的研发和市场推广提供了充足的资金支持。

值得一提的是,市场对Sohu芯片的预期非常高,目前Etched收到的预订单的数额已经达到了数千万美元,这对公司的创始人们来说无疑是一剂强心针。

Etched还在一篇文章中指出,当前AI芯片市场的需求已经达到前所未有的水平,Transformer的市场价值也从最开始不到5000万美元,到如今已超过50亿美元。

在创始人的透露下,Etched.ai的市场策略非常明确,公司专注于为那些对AI计算性能有极高要求的客户提供服务,包括大型科技公司、云计算服务提供商、AI研究实验室以及需要进行大规模数据处理的企业。

Etched.ai通过深入了解这些客户的需求,不断优化Sohu芯片的性能,确保其能够满足客户在处理速度、能耗效率和成本效益方面的要求

此外,公司也在积极构建生态系统,与软件开发商、云服务提供商和其他硬件制造商建立合作伙伴关系。

这种开放合作的策略,不仅能够在未来加速Sohu芯片技术的推广和应用,也能够帮助Etched.ai更好地理解市场动态,以快速响应客户的需求。

在他们的预想下,Etched 有望在 2024 年第三季度将其Sohu AI芯片推向市场初步计划是向主要云提供商销售

用Uberti的话来说:“我们把赌注押在了Transformer和Sohu上,这两都正在成为现实。”

三、Etched将成为世界上最大的公司之一

可以预见的是,Etched.ai的崛起的确会对英伟达构成一定的挑战。

长久以来,英伟达凭借其GPU在AI芯片市场中占据着主导地位,而这次Sohu芯片的高性能特性,正在逐步吸引行业的目光。

Uberti更是大胆表示:“如果我们打赌真的成功,Etched 将成为世界上最大的公司之一”

不过他们也很清醒的知道,Sohu在大多数工作状态下都无法击败GPU,因为它连Stable Diffusion都不支持,但在Transformer推理领域,Sohu将一举清空市场,成为新一代独属于Transformer的ASIC王者。

从整个AI芯片市场来看,Etched.ai打造出的Sohu芯片,不仅是对英伟达的挑战,更是在整个AI芯片行业技术进步的缩影。

Sohu芯片的推出,将激发行业内对更高效AI计算解决方案的探索和创新。这种创新的推动力,自然也会加速AI芯片技术的发展

正如今半导体行业两大龙头企业(三星、台积电)已经开始下一轮技术内卷,这也意味着芯片产业的发展又一次开上了快车道。

展望未来,Etched.ai和Sohu芯片的发展前景充满希望,但也伴随着不少挑战。

技术的不断进步和市场需求的不断变化,要求Etched.ai持续进行研发投入和创新。

同时,英伟达等老牌强者可不是坐以待毙的风格,Etched.ai的专业芯片理念一旦被市场所认可,怎样在拥有更大技术和供应链优势的强力对手面前活下来Etched.ai任重而道远。

总的来看,Etched.ai和三位创始人的故事,是对全球科技竞争中创业者精神的生动诠释,也是一条充满挑战与机遇的旅程,其背后同样代表着AI技术也在高速发展。

而随着全球科技竞争日益激烈,他们的未来到底如何,是真的变成一家科技巨头公司还是变成一段哈佛辍学生创业的新谈资?或许要不了几年就会有答案。

1、该内容为作者独立观点,不代表观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
11月13日消息,据媒体报道,亚马逊已将自主设计的Inferentia芯片替换掉原本伟达芯片,以此承担Alexa语音助手的部分计算。亚马逊表示,转向Infertia芯片后,公司成本降低了30%,该公司还透露,亚马逊基于云的面部识别服务“Rekognition”也已开始采用Inferentia芯片。据了解,该款芯片于2018年亚马逊首次发布,可加快机器学习任务的速度。
芯片商家伟达近日落户天猫,开出在中国的首家电商旗舰店——伟达GeForce旗舰店。
11月2日消息,芯片商家伟达近日落户天猫,开出在中国的首家电商旗舰店伟达GeForce旗舰店。目前,该店首页展示的商品主要包括显卡、电竞主机、游戏笔记本、轻薄本等,这些商品均搭载了伟达GeForce的终端产品。天猫双11第一波售卖10月31日晚8点正式开启。天猫公布的数据显示,开售1小时,102个品牌成交额过亿元。在102个首小时成交额过亿的品牌中,国货品牌占比过半,成为今年天猫双11一大亮点。
3月19日消息,芯片公司伟达日前表示,已与软银集团和LG Uplus Corp.达成合作,他们将于今年晚些时候在日本和韩国部署云游戏服务器。伟达表示,该公司已经创建了一个图形卡“pod”,可以同时支持超过1万名玩家在线观看游戏。伟达表示,软银和LG Uplus将利用“pod”卡提供服务,让客户通过5G观看游戏。
伟达止加密货币业务
8月23日消息,显卡和芯片制造商伟达的首席财务官科莱特•克雷斯正式宣布,终止其加密货币业务。克雷斯在一份声明中表示:“我们期待在发展的过程中不再需要加密货币业务。我们的收预期是,加密货币业务收为1亿美元,但实际收仅为1800万美元。我们预计该业务未来的贡献将微乎其微。
据路透社报道,当地时间周二,硅谷图形芯片制造商伟达公布了首款用于开发全自动驾驶汽车的计算机芯片,并表示有超过25家客户使用此芯片研发新一代无人驾驶汽车、自动驾驶出租车和长途卡车。新发布的芯片伟达“Drive PX”汽车线的第三代产品,代号为Pegasus,它的外观仅有汽车牌照大小,具有数据中心级别的处理能力。Pegasus每秒能处理320万亿次操作,相比前代产品PX
双11捷报频传的同时,芯片巨头伟达也落户天猫,开出在中国的首家电商旗舰店——伟达GeForce旗舰店。
3月29日消息,著名芯片制造商伟达公司CEO黄仁勋 于本周三表示,Uber只是使用了伟达的图形处理单元,也就是大家常说的GPU,并没有使用伟达的DRIVE技术。
3月28日消息,小马智行宣布与四维图新达成全面战略合作,双方将合力打造智能驾驶软硬件解决方案,并在高精度地图及定位等领域进行全面合作,加速相关产品的落地。除此之外,双方还将共同探索新一代智能座舱人机共驾导航产品等的技术演化和应用,提升自动驾驶的协同应用能力。在过去一年中,小马智行已经先后与广汽集团旗下如祺出行、一汽集团旗下一汽(南京)科技开发有限公司以及芯片供应商伟达达成合作。
8月17日消息,伟达公司CEO黄仁勋周四在回应特斯拉公司最终进军汽车芯片市场可能构成的威胁时表示,伟达为自动化机器开发的Xavier技术已经处于生产中,客户对这项技术感到“超级兴奋”。黄仁勋称,如果特斯拉的自主自动驾驶芯片项目失败,伟达“很乐意”提供帮助。
    Baidu
    map