行业新闻

行业新闻

从CPU到GPGPU,云服务器“核心”战场

发布时间:2020-01-07 点击数:1047

毫无疑问,2019年是国产AI芯片爆发的一年。大小筹码大会可谓是您的首次亮相。回顾今年发布的AI芯片,它们都有自己的特点和优势。特别是在他们擅长的特定任务上,它们的性能和计算能力甚至可以显着领先于某些GPU,谷歌的Tensor计算单元(TPU),特斯拉的自动驾驶计算单元(FSD)以及国内外各种类型的AI。新芯片产品,这就是为什么在新闻发布会上他们自己的产品声称具有性能和能效比可以成为NVIDIA GPU明星产品的原因。

云服务器核心GPGPU

但是它们真的超越Nvidia吗?显然不是,尤其是围绕Nvidia的生态系统不能动摇。其背后有许多因素,但是重要原因之一是,与TPU等产品相比,GPU可以做得更多。这些AI芯片只擅长做一件事,在该应用场景中仅比GPU好。换句话说,GPU更加通用或可用。

通用有多重要?对于数据中心和云应用程序,可以。


首先是成本。当芯片具有足够的通用性和广泛的可用性时,其销量可以满足对研发设计和最新工艺技术成本不断增长的需求。在“数量”方面,几乎没有针对AI专用芯片的惊人市场。


第二是灵活性问题。当前AI算法的迭代速度非常快,可能会从几个月到几周不等。该芯片基于18个月的开发周期。当芯片发布时,AI芯片可能已经落后了。


因此,我们现在看到的是GPU处于计算能力经济的大潮中。英伟达的股价不断上涨。

“将军”之王-GPGPU的兴起

相对于CPU,GPU在一开始就是一种专用芯片,早期的GPU专用于图形计算加速,而当GPU诞生时,它仍可作为ASIC芯片使用。但是,随着GPU的不断发展和演进,越来越多的通用属性(即可编程性)逐渐发展。

特别是自NVIDIA在2006年左右发布CUDA以来。CUDA是Nvidia在高性能异构计算领域中GPU应用中的一项重大创新。无疑,这是非常正确的举动。 CUDA可以直接基于C,C ++,Fortran,Python和其他语言开发应用程序。并建立了庞大的开发用户群,奠定了GPU可以广泛使用的技术基础和生态力量。


当然,这也是由于大数据时代的到来,所有行业都需要更强大的计算能力。 CUDA的推出启动了Nvidia的GPGPU(通用GPU)战略-当大多数人对GPU的理解仅限于游戏图形的加速时,GPGPU的时代就此开始了。


GPGPU,有人称它为GP2U(GP的二次U)。这两个GP代表不同的含义:后一个GP代表图形处理,而我们所说的U组合就是GPU(图形处理器);前GP代表“通用”。 GPGPU不是特定的芯片,而是将图形处理器用于某些非图形渲染高性能计算的概念。

从狭义上讲,GPGPU基于GPU进行了优化,使其更适合于高性能并行计算。它可以使用高级编程语言,并且在性能,易用性和通用性方面更强大。


在应用程序领域,GPGPU将应用程序扩展到图形之外。 GPGPU在科学计算,区块链,大数据处理,工程计算,金融,基因等领域得到了广泛的应用,其科研成果和新的应用模式正在兴起。


从上图可以看出,GPU用于AI计算。无论是云训练还是终端推理,其本质都是GPU一般属性的一个方向。换句话说,人工智能计算只是GPGPU世界中的组件之一。只有AI计算在此方向上具有巨大潜力,因此GPU制造商已将AI计算作为开发和推广的方向。
如果将CPU与数学家进行比较,将GPU与艺术家进行比较,则GPGPU可能应该是... Leonardo Da Vinci。

  “战场”

目前,全球GPGPU领域的参与者似乎已处于控制之中。
实际上,早在2006年左右,AMD就发布了“流处理器”,这是AMD最早的GPGPU尝试。但是当时的“流处理器”只是GPGPU的“胚胎”,远未显示GPGPU的真正威力。


从那时起,AMD在GPGPU方面做的还很少,甚至后来出现的开放计算语言(OpenCL)也由Apple开发。这也使AMD失去了在GPGPU中与Nvidia竞争的机会,因此它处于追赶者的象限。


但是,英特尔也正在加快通用GPU的部署。英特尔知道,GPU的过路人知道这是一段痛苦的历史,从不屑一顾到GPU的发展,再到基于自己的x86架构的独立显卡的开发,英特尔十年来一直没有一款像样的GPU。据报道,在过去的两年中,英特尔将在2020年推出首个独立GPU。这可能是由于英特尔沉重的资金筹措-AMD RTG图形部门前负责人,禅宗架构的功勋领袖吉姆·凯勒(Jim Keller)–和图形技术市场。这些神灵的导演达米安·特里奥莱特(Damien Triolet)是英特尔于2018年招募的。


可以想象,对于英特尔来说,这是整个2020年。显然,英特尔制造传统显卡的意义不大。在异构计算时代,只有将英特尔瞄准数据中心时,它才决定触发GPU的触发。


再说一件事,英特尔最强大的生态系统是x86架构CPU。英特尔的策略可能是从CPU生态学的角度探索一种更紧密的方法来组合CPU和GPU。
作者采访了相关行业的技术人员,并了解到开发GPGPU的困难在于以下几个方面。


从硬件的角度来看,核心是指令集。指令集的覆盖范围,粒度和效率决定了芯片是否可以覆盖足够广泛的应用市场区域以及是否对软件开发和产品迭代友好。无论是Nvidia还是AMD的GPGPU,指令集都在上千左右,而大多数国产AI芯片指令集都在一百以内。类型和数量之间的差异映射到高效硬件实现的复杂性。差距很大。在这方面,国内队之间还存在一定差距。另一个重要方面是基于硬件层的任务管理和智能调度。这使芯片可以提高硬件层的计算能力利用率,这是每个人都经常说的实际计算能力。大多数AI芯片的实践完全取决于软件层的调度实现,但这种方式首先会增加软件开发的复杂性,其次会降低硬件计算能力的利用率,其次会迭代地更新软件堆栈。速度。毫无疑问,这在面临AI模型,开发环境和应用场景加速更新的情况下,极大地增加了在AI环境下产品着陆和工程设计的难度。


在软件方面,毫无疑问,最重要的是开发生态。通过英伟达(Nvidia)十多年的工作,GPGPU已经建立了一个庞大而成熟的生态CUDA,拥有超过160万开发用户。人工智能芯片需要建立新的生态。这将在两个方面带来重大问题。第一个维度是客户。客户需要漫长的适应期才能从原始开发环境切换到新的软件生态系统。它不仅带来了资源,延迟了业务部署的时间窗口,增加了业务的不确定性,更严重的是不利于保护现有的软件投资,而且软件的许多部分都必须重写和修改。适应。企业用户非常敏感和谨慎。另一个方面是产品开发方面。从底层芯片和系统软件来看,跳过CUDA层以直接支持开发框架将不可避免地带来巨大的软件投资,并不断跟上现有框架的新版本和生态巨人的新框架。缺乏底层软件人员。


归根结底,以上两点需要人为解决。恰恰是中国企业目前最缺乏该领域的人才。目前,只有Nvidia和AMD拥有丰富的团队,这也证明了英特尔为何折腾几年并最终邀请AMD的诸侯神。

实际上,如果您仔细考虑一下,就很容易理解通用GPU已成为士兵的战场,至少有两个主要的驱动因素。从好的方面来说,现在是异构计算的世界。近年来,传统的基于CPU的服务器市场增长相对较慢,而GPU服务器却迅速增长,据报道年增长率超过60%。
潜在因素是5G时代的到来推动了物联网的快速发展,应用场景变得更加丰富和多样化。这需要云计算资源为各种复杂场景的需求提供丰富而灵活的计算支持。工程师更愿意将“全能”芯片焊接到服务器上。

老虎可以碰的“老虎屁股”

在GPGPU周围,外国已经在相互对抗。另一方面,在国内,很少有芯片制造商能够了解GPGPU的发展机会并采取行动。
华为是看到GPU总体趋势的为数不多的芯片制造商之一,而且看起来它正试图两条腿走向GPGPU。一种方式是,通过积累手机芯片,华为希望从移动GPU开始,逐步扩展到平板电脑,台式机和服务器,并遵循从简单到复杂,从小芯片到大芯片的道路。


另一种方式是“意味着天龙寺的僧侣们一起练习六脉冲魔剑”。通用GPU复杂且难以实现。华为“简化了复杂性”。今天,我们将做AI-GPU,明天将做“区块链GPU”,明天将做“超级计算GPU”。 ,“六脉冲Excalibur”通用GPU成为了。看起来不错吧?但是这个想法可能太理想化了。通用GPU并非简单的“ 1 + 1”。十个人将有一个正手指,而没人会拥有六脉冲魔剑。这说得通。


我还听说阿里巴巴的芯片部门也希望成为GPGPU,但是阿里巴巴的野心更大,但没有足够的技术团队来支持这一点。
在其他制造商中,包括寒武纪,Itu,Bitmain和Ebara Technology等,他们目前专注于AI芯片,并利用自己的优势摆脱了自己的风格和水平。
在GPGPU轨道上,一家名为“ Days Knowledge Core”的公司选择了正面的“ Gang”。目前,该公司已经聚集了一支由100多人组成的技术团队,围绕GPGPU系统进行研发。其中,AMD一直是美国和上海GPU的核心团队成员,以及拥有20多年行业经验的世界级技术专家。今年刚试水并发布了Edge芯片,并计划明年正式发布GPGPU大型芯片产品。

“牧村波动”

本文并不是说Nvidia以外的其他芯片没有机会,而只是一个可能越来越接近的事实:泛化,标准化。
1987年,日立公司前总工程师Tsu本刚(Tschi Makimoto)提出,半导体产品未来可能会交替走“标准化”和“定制”之路,每十年波动一次。他在1991年的《电子周刊》上发表了这一想法,称其为“卷本之潮”。

近年来,可编程芯片的飞速发展已经证实了“ Muracura Volatility”的正确性,并收到了Xilinx和Altera等可编程芯片供应商的回应。一位德国教授甚至将“ Makimura波动”称为“ Makimura定律”,并认为,当半导体技术接近极限时,“ Makimura定律”将超越摩尔定律。半导体技术将依靠“牧村定律”来维持其较高的未来。提高创新速度。


2020年临近。在过去的几年中,我们一直在呼吁使用AI芯片和高性能计算芯片。如果Makimoto的Wave仍然有效,那么下一个高峰将是具有超高灵活性集成的芯片。


毫无疑问,在计算能力经济时代,全世界正面临着半导体市场的增长潮,并且各种半导体公司已经出现在市场中。 NVIDIA早就凭借其强大的GPU + CUDA解决方案切入了各个领域,并积累了投入大量研发投入和时间的坚不可摧的生态城墙,这恰恰是国内外其他公司的薄弱环节。
国内芯片公司,特别是在创业初期的芯片公司,“正确的选择胜于百倍的努力”。我认为通用GPU确实是一个非常值得的方向。 GPGPU只有十岁了,“护城河”并非坚不可摧。


在此阶段,国内替代产品还必须在CUDA生态学的基础上推广自己的芯片产品,同时建立与CUDA兼容的新生态学。该过程中的每个步骤都是至关重要且具有挑战性的。

全网数据为大家提供专业的深圳服务器租用,深圳服务器托管,深圳主机租用,云服务器租用等国内外服务器资源,详情欢迎咨询客服了解。



用户至上,用心服务

全网数据以"用户至上,用心服务每一位用户"为宗旨,您可以把您的应用放心的交给我们,全网数据为您提供完美解决方案和数据中心服务。

免费咨询