你好,我是邵巍。

我在讲完第17讲“拓展阅读:聊聊 ARM 与 RISC-V”后,不管是从专栏还是微信上,一众网友给我留言说,刚开个头,就结束了,其实我自己也觉得还没有讲透,所以我要加个餐,再聊聊这个话题。

7月份我参加了两个活动,一个是华东师范大学的暑假学校,我做了三个小时的“ARM架构演进历史与现状”主题演讲。另一个活动是第一财经举办的线下沙龙,题目是“来聊聊智能时代的下一个大生意”,当然这个大生意,就是半导体生意,更准确的说,是中国的半导体生意。活动不但请了芯片产业的人,还请了关注芯片产业的投资机构。这两次交流活动,我各有所得,刚好可以再给你补充一下第17讲没讲完的故事。

首先,能在华东师范大学的暑假学校做这个演讲,是因为我手头有本ARM 25周年时出的公司历史书。这本图文并茂的内部大册子从Acorn年代只有40多条指令的ARMv1架构讲起,那个时候只有3级流水的ARM1 CPU Core只是研究性质而并没有商用,一直讲到2014年,ARM Cortex-A占据了移动计算市场,成为第三代计算的核心关键技术。可以说,这本册子包含着每一代产品背后的人、技术、商业故事,是官方版本的八卦。

我觉得值得花时间给大学生做这个讲座,是因为ARM公司的历史,就是一部英式RISC CPU技术的发展历史,同时也是一种实用的谨慎经营与商业创新相结合的半导体公司发展史,值得他们去了解。

ARM是首创了IP授权这种商业模式的,对现代的半导体产品IP、IC设计、IC制造的产业链分工模式都有贡献。它跟我在大学时老师讲的偏美式的半导体技术和发展非常不同。其实想想,台积电首创的代工模式,和ARM首创的IP授权模式,都是非美国的半导体公司,在美国强大产业链压力下,生出的不同的竞争方式。从这个角度理解,ARM就更值得学习了。

回到ARM公司的产品,ARM1/ARM2 CPU Core只有3级流水,没有Cache,然后ARM3增加了一级Cache,到ARM6增加了MMU。对比Intel,到了2000年,Intel已经进入到有20级流水、L2 Cache、主频1.5Ghz的奔腾4的设计了,同年,算得上是ARM历史上非常成功的ARM7,仍然是一个3级流水,一个L1 Cache的CPU核。

你可能想问,流水线级数没有人家多,这是意味着ARM不如Intel吗?用今天的眼光看,现在大学里计算机体系结构的课程,都从5级流水的CPU核开始讲起了。

但其实ARM看似简陋的3级流水,成就了极低功耗、极高能效比的处理器产品路线,而Intel的20级流水适合高主频高性能实现,在市场上两者都是成功的产品路线。不同的PPAC(Performance性能、Power功耗、Area面积、Cost成本)取舍,让ARM在手机市场上大获成功,在半导体行业第一名Intel的最核心技术领域,另辟蹊径开创了新天地。

不过胡伟武老师在《计算机体系结构》这本教科书里说得好,计算机体系机构、操作系统、编译原理、数据库原理等计算机专业的核心课程就是研究怎么造计算机的,是计算机专业学生的看家本领。可惜,我们国家计算机行业起步太晚,几次自己造计算机的机会,都不是很成功,这个看家本领还很生疏。

当然,其实放眼全世界的计算机产业界,自x86、ARM之后,其它的指令集架构都不成功,直到RISC-V出现。

从这点上,无论RISC-V最终能走到什么位置,我们这代人都是幸运的,这是时代给予我们的机会,因为你可以从头学习,可以参与到一个计算机指令集产业的从无到有,到加速发展的整个过程。不仅中国的态度是这样,整个世界对于RISC-V的态度也如此。这是一次产业界的大规模试错的机会。

我在第17讲的时候,泛泛地说到了一些RISC-V的优点,这里我要再提炼一下,在今天,RISC-V最大的优势有三点。

第一,开源优势。 开源,其实并不是意味着免费,而是意味着自由。整个学术界、产业界被半导体行业的残酷竞争压抑得太久,而RISC-V的出现是一个难得一见的推倒重来,大家一起重新造轮子的“革命”。不是为了所谓一个新兴市场或一个未解难题,而是现代计算机产业技术发展成熟到一定阶段,人人“能”且希望有机会实习一下“造CPU”的看家本领。

开源确实是一次革命,从商业到技术的全面革命。虽然硬件和软件开源的公式不相同,开源硬件项目,如何能进入良性的商业循环,还是整个产业界需要摸索的话题。但是开源,是RISC-V成为唯三有可能存活下来,形成“三国鼎立”局面的指令集系统的主因。

其次,产业发展需要领域专用架构DSA(Domain Specific Architecture)的硬件。 你可以理解为不是产业需要RISC-V,而是产业需要DSA硬件,而RISC-V有可能成为DSA的最优解。

不知道你是否还记得,半导体的上一轮竞争为什么是通用处理器干掉了专用处理器(我曾经擅长的网络处理器就是受害者),是因为软件。软件的开销激增,在一个项目中的占比越来越高,已经超过硬件的开销,成为一个项目的主要成本。而通用处理器能更好地保护软件的投资,因此在十年前,通用处理器把大部分活跃的专用处理器都用“软件定义网络”“软件定义存储”“软件定义xx”的口号干到消声灭迹了。

但是世界是有轮回的,一方面是摩尔定律的变缓,通用处理器性能提升缓慢,另一方面是互联网、移动计算带来的算力需求的爆炸式增长,市场重新燃起对DSA的强烈渴望,这也解释了NPU、DPU的兴起。但是长期看,项目的总成本(硬件开发成本+软件开发成本)在增加,让每个产品经理都会倾向于选择可以参与平摊软件成本的高性能硬件架构。

RISC-V的指令集开源,既给了产业界尝试DSA的自由,又用模块化的的设计给了产业界一个共同开发软件的可能性。

最后一个优势,中美之争给了所有“非美技术”一个机会。 x86属于Intel(美),ARM原本是中立的,但是在2020年9月,美半导体巨头英伟达与日本软银达成协议,准备以400亿美元天价收购ARM,并计划在2022年3月前完成这笔交易,但目前大概率会延期,如果英国政府能站出来坚决否决英伟达对ARM的收购案,那么ARM就会被打上一个“非美”的标签。

当时收购新闻一出,整个产业界一片哗然。本来ARM作为一个商业可用的架构,一直以非常中立的态度协同整个产业界,合力建立了庞大的ARM指令集生态,这是产业界最大的、可用的、开放的CPU指令集生态。如果ARM被英伟达收购,则意味ARM指令集有极大的可能性变成英伟达的私有指令集,如同Intel/AMD拥有x86指令集一样。但是如果英国政府能站出来否决,从地缘政治的角度,也就排除了“ARM”被任何美国企业占用的可能性。

ARM结局尚未确定,而RISC- V是作为“开源独立”精神的代表而不依赖于任何国家存在的。因此,不仅仅在中国,在欧洲、日本、印度,都有非常活跃的RISC-V团队,当然美国若干个团队也是很活跃的。

在这一波浪潮中,中国额外突出。在国际上关注度最高的是阿里巴巴平头哥,一方面当然是因为阿里巴巴作为互联网大厂,本就是这轮芯片浪潮中的新入局者。产业界对开源硬件一个最大的担心,就是项目的可持续性,有阿里这样的大树,不但持续投入的问题迎刃而解,连产品落地的场景似乎也可以期待。

另一个方面平头哥的产品确实抢眼。2019年7月,平头哥发布了性能非常强悍的RISC-V IP核玄铁910。2021年3月,又在玄铁910上成功运行安卓系统基础功能,这是芯片行业首次实现RISC-V架构对安卓的支持。

靓丽产品的背后,是一个有十年以上CPU设计经验的老牌团队,因此玄铁910,不仅性能业界领先,而且扩展了50余条指令。这里我有所感触,似乎成功的CPU团队,都是10年以上CPU设计经验的“老”团队。说回产品本身,从平头哥现有产品矩阵上看,也确实是全而精,被高度关注实属正常。

跟平头哥的商业路线相对,中国科学院计算技术研究所包云岗研究员(我在17讲有提过包老师的高质量翻译作品:RISC-V手册)带领的香山处理器项目组,交付了第一款开源国产处理器。这款处理器,不仅仅是开源处理器,而且是一个开源的平台,采用了非常前沿的Chisel语言。更为可喜的是,在这个项目背后,还有一小撮商业公司,例如优矽科技高调跟随。这很让人联想到当年Linux开源之后,是红帽、SuSE这样成功的商业公司的崛起。

在7月份第一财经的线下沙龙中,我从慧智微电子的CEO李阳先生那里学习到一个说法,“半导体行业是一个追击任务,不是一个爬山任务。这是半导体行业不同于‘原子弹’的地方。”深以为然。

爬山任务,是爬到山顶就算成功,而且不计时间。山就在那里,等你尝试。而发展半导体是一个追击任务,是公司与公司之间的竞争,是产品与产品之间的比较。一代产品的成功,只是一个追击任务中的一个点而已。

对于CPU这样一个核心产品领域,有一家或者几家有能力持续交付世界一流水平产品的商业公司,整个中国产业界等了太久。

2018年到2019年是AI、NPU的机会,2020年是GPGPU的窗口,2021年是DPU的天时,我个人预计2022年将是中国CPU的启动之年,无论是ARM派的CPU,还是RISC-V派的CPU,都有机会各领风骚。

好了,到这里,我想聊的就讲完了,你可以畅所欲言,聊聊对于ARM、RISC-V你知道的内容,欢迎在评论区和我交流。