自给自足,Amazon决定弃用博通,自研网络芯片

据The Information报道,亚马逊正在为其硬件网络交换机开发定制的硅芯片。据说这些芯片可以帮助亚马逊改善其内部基础设施以及AWS,这是亚马逊于2015年以3.5亿美元收购以色列芯片制造公司Annapurna Labs的目的之一。

 

image.png

报道进一步指出,亚马逊为其交换机构建芯片可以帮助其解决自身基础架构中的瓶颈和问题,特别是如果他们还定制构建在其上运行的软件时。亚马逊已经建立了自己的交换机,但是它依靠Broadcom为其提供芯片支持。对于公司来说,完全控制这些机器是很有意义的,特别是考虑到其Web服务业务的重要性。The Information援引Amazon提供的机器学习软件(目前运行在Annapurna芯片上)的话,他们甚至有可能通过新的交换机提供一些以前无法提供的服务。

 

报道指出,这颗芯片不是亚马逊的第一个定制芯片。该公司此前曾与联发科合作为其Echo智能扬声器产品创建芯片,旨在使Alexa更快地做出响应。它还有被称为Trainium的自定义机器学习芯片,该芯片将很快对AWS客户开放。为此该公司还希望自己的芯片为其网络的骨干提供支持,这是有道理的。

 

定制芯片设计也迅速成为大型科技公司的赌注。我们最近看到有报道称,谷歌和微软正在为其设备构建自定义处理器,而苹果公司已经这样做了多年,M1 Macs就是一个例子,当公司的产品同时控制两个设备时,它们的性能可能会更高。硬件和软件。尽管亚马逊可能不是智能手机或PC领域的巨人,但它在云计算中却是一个巨人,这似乎是亚马逊着力于使新芯片投入使用的地方。

 

延伸阅读:思科芯片外售,与博通正面开战

 

如果我们从同一个供应商处购买ASIC,软件、计算,存储或网络设备,这是毫无问题的。但是,如果这是唯一的选择,那就有问题了。这正是超大规模开发者和云构建者在交换机业务上进行长期斗争的原因,这在Facebook上体现得最淋漓尽致。

 

因此,我们看到了商业硅ASIC供应商的兴起,首先是交换机,然后是路由器,还有那些可以负担如此大投资的超大规模生产者和云构建者的自有网络操作系统的兴起。

 

实际上,考虑到规模和网络的复杂性,他们别无选择,只能进行此类投资并创建商业交换机和路由器供应商无法提供的NOS。在它们的背后,我们看到了一堆便携式NOS,其中一些是开源的,有些不是开源的,它们可以跨越多个交换机和路由器ASIC,并且,其中一些芯片甚至都不是来Broadcom。

 

在商用芯片供应商和未与任何特定交换机或路由器制造商结盟的备用NOS兴起的二十年后,路由先驱和交换巨头Cisco Systems于2019年12月推出了Silicon One Q100路由,从而在市场上占有一席之地。据思科研究员和Silicon One系列ASIC的架构师Rakesh Chopra称,该芯片已经在Cisco 8000系列路由器中实现了商业化。到目前为止,Rakesh Chopra认为这是Cisco本身唯一基于Silicon One Chippery的产品。

 

但是,Chopra不能说的是,hyperscalers和云构建者等其他人是否正在Silicon One的产品线上构建自己的交换机和路由器,该产品线在2020年10月得到了扩展,而今天已经得到进一步扩展。

 

在进入扩展的Silicon One系列之前,我们想做一个有趣的观察。交换机或路由器(比数据中心中的任何其他类型的设备更多)一直是黑匣子。网络设备的硬件和软件组件就像受保护的国家秘密一样,在市场上专有且与众不同,而客户真正获得的是以给定速度以特定形状因子收集的一组端口,并在软件中实现了一组API和功能。

 

虽然最大的客户都可以使用SDK,还可以通过开放平台来实现更大的延展性和针对特定需求的定制,但对我们而言,有趣的是,芯片本身仍然基本上是一个黑匣子,这与我们都熟悉的商用CPU芯片甚至与那些实际上只会由其专有供应商在特定机器上使用的CPU芯片完全不同。交换机和路由器ASIC自己是数据中心的最后堡垒。您很幸运地找到了用于蚀刻它们的工艺技术,并获得了Broadcom,Innovium,Intel,Marvell,Nvidia和现在的Cisco所拥有的SERDES速度和SERDES数量。您很少会看到框图,甚至很少会看到。

 

如您所料,我们认为情况应该有所改变。但是,直到做到这一点,我们才能获得封装照片以及一些基本的提要和速度,并且在今天将三款新的ASIC加入生产线之后,思科的Silicon One系列看起来像这样:

image.png

 

在过去的十五个月里,思科推出了在网络中扮演九种不同角色的交换机和路由器ASIC,这是与Broadcom和其他供应商及其交换机和路由器制造联盟合作的一个很好的开始,思科为此在过去十年里付出了很多努力。

 

我们在他们于2019年12月发布的Q100路由芯片方面做得不好,我们也忽略了他们2020年10月发布的公告,当时思科推出了三款额外的路由芯片和三款交换芯片,它们都基于相同的Silicon一种架构。现在,我们想对思科的芯片进行深入的解读。

 

为了达到这个目的,我们与Chopra一起度过了一段时间。自从将近七年前构思以来,他就一直密切参与Silicon One的工作。Chopra于1997年从Rensselaer Polytechnic Institute获得了计算机工程学士学位,此后一直在Cisco工作,最初是一名硬件工程师,后来获得了晋升。

 

“从Silicon One的角度来看,我们开始像独立的硅公司一样运作,” Chopra告诉The Next Platform。“在此公告以及去年10月的公告中,我们没有宣布任何使用这些芯片的Cisco产品。我们是思科内部的独立机构,我们的章程是发展Silicon One和替代业务模型的业务。

 

当我们与外部客户进行讨论时,我们将进行一次标准的ROI讨论,考察我们为某人服务需要花费多少精力,以及我们将产生多少交易量和多少收入。在此基础上,我们将决定是否执行此操作。”

 

尚不清楚可能会有多少hyperscalers、云构建者和开关OEM/ODM制造商使用或考虑使用Silicon One ASIC。但是所有人都在谈论它。从思科首席执行官查克·罗宾斯(Chuck Robbins)几周前的讨论中可以看到,思科付出了多年的努力来重新投入到超大规模生产者,云计算构建者以及其他方面。正如思科所称的那样,“网络级”服务提供商和电信运营商正在获得回报。Robbins表示,在前四个季度中,对网络缩放器的销售额平均占服务提供商总销售额的21%,在2021年1月这一季度达到25%。一些客户购买原始的Silicon One ASIC,一些客户购买整个Cisco 8000路由器。

 

Silicon One架构的秘诀在于其名称,体现在它具有一个单一的,统一的架构,该架构既涵盖交换和路由,又包含所有设备的所有功能,这与公司在使用Broadcom、Intel、Marvell或Nvidia的多种产品时必须应对的平衡方法不同。因为各个芯片系列的功能集并不总是相同的——对于Broadcom的“ Trident”和“ Tomahawk”交换芯片以及“ Jericho”路由器芯片,即使软件相似,但他们有不同的定价方式。

 

Chopra解释说:“ Silicon One的构建方式与行业中的其他任何技术都根本不同。”,“内存结构的工作方式,处理引擎的工作方式使我们能够做以前完全不可能的事情。

 

因此,如果您查看市场上的其他芯片,例如在路由市场中,它们是由两个流水线阶段组成的,它们有两个阶段用于专用结构接口。我们拥有一个完全可扩展的架构,其中可以包含许多可以随技术节点线性扩展的切片。我们可以完全共享我们的所有内存,而不必复制内存状态。就构建路由和交换芯片而言,这是一个非常根本的转变。

 

我们已经奠定了基础,现在我们有了这样的基础结构,我们对这些新的芯片之一所做的所有工作就是调整切片的数量,调整各种tables的比例,调整内存,然后再制造它。这就是为什么您看到这些设备如此之快的原因。因为所有这些设备实际上在架构上都是相同的。我们只是更改了切片的数量。它们都运行相同的P4转发代码,并且运行相同的SDK。我们根据是要追随网络规模市场还是路由市场来调整一些规模。我们调整数据包缓冲区的大小或添加外部缓冲区。但是,这些功能在功能上都是相同的,因此,如果您使用其中一个,则可以立即使用其他任何一个。没有必要进行再教育。

 

相同的ASIC可以用于固定端口设备,例如机架顶部常见的1U和2U交换机,分解的叶形/旋转式机箱,其中一些ASIC用作结构元件,有些用作线路线卡,或者在固定的设备中使用。模块化交换机,它以硬编码方式实现线卡上的ASIC与结构上的ASIC之间的连接。

 

在上图中,于2019年12月推出的Q100芯片的总路由能力为10.8 Tb / sec,聚焦的也是路由市场。2020年10月,思科增加了三款新的路由芯片,其中Q200的运行速度为12.8 Tb /秒,Q201的运行速度为6.4 Tb /秒,Q202的运行速度为3.2 Tb /秒。他们还增加了相同速度的交换芯片Q200L,Q201L和Q202L,从而使Silicon One设备的总数增加到了七个。

 

但是,思科做到了这一点,Chopra并未表示。与竞争对手相比,Silicon One芯片具有更高的性能和更低的功耗。我们不知道思科将与哪些供应商的芯片进行比较,但是很有趣的是看到它们被贴上标签,并且也与思科的前几代路由器芯片进行了比较。无论如何,我们的想法是这些是代表性的比较:

 

image.png

 

使用Q200芯片的Cisco Silicon One设置可以在1U机箱中以400 Gb /秒的速度提供32个端口,而其他两个端口则需要2U或3U机箱。并查看功耗:

 

image.png

 

Chopra表示,Q200的390瓦热封壳(thermal envelope)“非常保守”,在现场可能会低很多,重要的是,将比使用Q200的光收发器将钩子拉入交换机的功率低。重要的是这个总数是开关ASIC功率加上光功率。

 

与竞争产品相比,思科产品在每个机架单位的端口密度上升且每个端口的功耗下降。这就可以使超级扩展程序和云构建者以及电信公司和服务提供商中的同行充分理解。

 

这使我们了解了今天添加的三个新芯片。首先,有一个25.6 Tb / sec的交换机ASIC,即G100,它与Broadcom和Nvidia在总交换容量方面的能力相匹配。另外还有8 Tb / sec的路由ASIC,Q211和8 Tb / sec交换ASIC,即Q211L,许多欧洲的webscale公司已要求Cisco提供以匹配其设备中当前ASIC的总带宽。大概这将使他们能够做一个盒子来替换盒子,而不必重新构造或重新布线他们的网络。

 

综上所述,Chopra表示,Silicon One在数据中心的交换和路由,服务提供商和Webscaler以及不同的外形尺寸都具有相当好的覆盖范围:

 

image.png

 

看到超扩展程序和云构建器的功能将很有趣。他们中的一些人摆脱了思科的支持已经花了十年的时间。现在,他们有机会将其软件迁移到Cisco芯片,并在整个数据中心以及整个数据中心范围内统一其ASIC,或者至少使Cisco与Broadcom和其他新贵抗衡。

声明:本站转载此文目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。

编辑:乾坤芯,如若转载,请注明出处:https://www.qiankunxin.com/221.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注