世界上最快的AI芯片介绍
发布时间:2023-12-08 20:09:21 所属栏目:外闻 来源:DaWei
导读: 这两天,IBM低调地发了一个新闻,推出了一款类脑芯片“北极”(NorthPole),对比4nm节点实现的Nvidia H100 GPU相比,NorthPole的能效提高了五倍,成为当之无愧是现在世界最强的A
这两天,IBM低调地发了一个新闻,推出了一款类脑芯片“北极”(NorthPole),对比4nm节点实现的Nvidia H100 GPU相比,NorthPole的能效提高了五倍,成为当之无愧是现在世界最强的AI芯片。 首先,IBM的“北极”NorthPole是一种类脑芯片,我们需要先了解什么是类脑芯片。 所谓类脑芯片,顾名思义,就是一种高度模拟人脑计算原理的芯片,基于对现代神经科学的理解,反复思考如何从晶体管到架构设计,算法以及软件来模仿人脑的运算。如果把类脑芯片做得更像人脑,就会被赋予一个新的名字—神经形态计算(Neuromorphic Computing)。 想造一颗这样的芯片,可不是光是变变器件结构的就行的,而是从材料、器件、电路、架构带动算法和应用改变的。一言蔽之,就是集合各种最先进的技术,才能造出这样的芯片。 虽然实现路径很多,但奈何这种芯片技术难度太大了,且不说好不好造,设计出来就很难了,所以目前也在开拓阶段,都还无法达到商业化水平。 之所以类脑芯片还未形成大规模商业化,一是因为设计难题依存,就拿英特尔、IBM都看好的CMOS型,多块全数字异步设计的芯片互联、芯片连接的有效性和时效性以及软件层互连计算、分布式计算和灵活分区等问题都难以解决;二是制造、软件和生态都要完全推翻,虽然硅基晶体管路线部分可复用,但底层不可能完全照搬,这就进一步加剧大规模商业化难度。 类脑芯片实在太香了,笔者了解到,某些情况下,完美的神经形态芯片可以用比传统解决方案低1000倍的能耗来解决问题,这意味着我们可以在固定的功耗预算下,打包更多的芯片来解决更大规模的问题。 结构上,目前全世界的类脑芯片基本都一致,都是由神经元计算、突触权重存储、路由通信三部分构成,同时采用与脉冲神经网络(SNN)模型。 但依据材料、器件、电路,分为模拟电路主导的神经形态系统(数模混合CMOS型)、全数字电路神经系统(数字CMOS型)、基于新型器件的数模混合神经形态系统(忆阻器是候选技术)三种流派。 全球范围内,参与神经形态计算芯片开发的机构主要包括三类:英特尔、IBM、高通等为代表的科技巨头企业,斯坦福、清华为代表的高校/研究机构以及初创企业。 当然,需要强调的是,数字CMOS型还只是最初阶的类脑芯片,还算不上完全模拟人脑的神经形态器件,只能算是一种借鉴神经形态理念的一种芯片。但光是借鉴人脑,这种芯片就能够碾压世界上任何一种芯片。IBM的NorthPole就是这样的数字CMOS型的类脑芯片。 IBM的芯片,什么水平? 沉寂8年,“北极”(NorthPole)问世,NorthPole就是建立在IBM最后一颗类脑芯片TrueNorth基础之上,彼时TrueNorth就有着比传统微处理器低四个数量级的能效比,对比一下二者,就能很直观地感受到IBM技术的变化: 单个TruNorth芯片包含4096个计算核心,可以实现神经突触和神经元排列的动态映射。IBM TrueNorth系统的一个吸引人的功能是,单个芯片由54亿个晶体管组成,仅消耗70mW的功率密度,仅占传统计算单元的1/10000; NorthPole采用12nm节点工艺制造,在800平方毫米内集成了220亿个晶体管,有256个内核,在8位精度下,每个内核每个周期可执行2048次运算;在4位和2位精度下,运算次数有可能分别增加一倍和四倍。运行基于人工智能驱动的图像识别算法速度是目前市场上同类芯片的22倍,能效是同类芯片的25倍。在不使用最先进工艺的情况下,NorthPole芯片能耗是使用最先进技术的人工智能芯片的1/5。总体而言,NorthPole的速度大约是TrueNorth的4000倍。 计算资源方面,NorthPole每个单元都经过优化,可执行精度较低的计算,精度从2 bit到8 bit 不等。为保证执行单元使用,它们不能根据变量值执行条件分支,也就是说,使用者代码不能包含if语句。这种简单的执行方式使每个计算单元都能进行大规模并行执行。在2 bit精度下,每个单元可并行执行8000多次计算。 存储方面,所有的内存都被封装在一颗芯片内,这意味着每个内核都可以轻松地访问芯片上的内存。设备外部来看,NorthPole看起来像是一个主动存储芯片,这有助于将NorthPole集成到系统中。 不止如此,这款NorthPole目前采用的是12nm纳米节点工艺制造,目前CPU最先进的技术是3nm,而IBM还在研发2nm纳米节点技术,如果用上2nm,可能IBM的类脑芯片性能还会再提升很大档次。 NorthPole的潜在应用主要包括图像和视频分析、语音识别以及Transformer神经网络,这些网络是为ChatGPT等聊天机器人提供支持的大型语言模型 (LLM) 。这些人工智能任务通常会用于自动驾驶的汽车、机器人、人工智能助理和卫星数据等领域。 (编辑:大连站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
推荐文章
站长推荐