曦智科技CEO沈亦晨:用光子芯片加速智能算法和智能计算

  • Post category:国内新闻

11 月 20 日,由苏州市相城区人民政府与《麻省理工科技评论》联合主办的 EmTech China 2020 全球新兴科技峰进入第二天议程。今年,EmTech China 邀请到了数十位顶级科学家、海内外院士、商业领袖、科创精英莅临现场,探讨新兴科技发展现状及其为人类社会带来的巨大影响。会上,曦智科技联合创始人兼 CEO 沈亦晨分享了光子芯片加速智能算法和智能计算的主题演讲。

麻省理工科技评论

以下为经过整理后的演讲实录:

大家好,我叫沈亦晨。今天听了那么多演讲,我觉得基本上可以确定大数据时代已经来了,大数据时代和智能时代最关键的两要素之一是数据。我们肯定需要越来越多的海量数据来帮助我们训练更智慧的模型。

第二个同样重要的元素,就是处理数据硬件、也就是芯片。未来的应用数据和采集数据的终端一定会越来越多。在未来十年里,数据量一定会继续呈指数级增长。

另一方面,处理数据的硬件在过去十年里发生了很多事情。如果大家把 2020 年的电脑和 2010 年的电脑相比,可能你会发现 2010 年的电脑还可以继续跑现在的软件。但如果用 2000 年的电脑去跑 2010 年的软件,我敢保证 99% 的软件都跑不起来。

这说明电脑里电子芯片的发展和算力已经慢慢变得越来越慢,原因是受制于物理极限。随着一步步的迭代,每一次迭代带来的算力红利已经逐步减少,从 16 纳米到 7 纳米、再从 7 纳米到 5 纳米,可能很多人只看到 10% 到 20% 的增长。但是再往下一步,增长只会越来越小。

在未来 10 年里,用增长越来越缓慢的电子芯片去匹配一个增长越来越快的数据需求,这可能是目前该领域的最大挑战。整个电子芯片行业很早就意识到这一问题,所以也在不断尝试做出更高性能的电子芯片来满足数据需求。

以市场上用得最多的旗舰产品为例,其中之一是 2015 年的英伟达 GPU 芯片,整个芯片从面积上来看大概有 600 平方毫米,能耗大概是 100W 左右。此外,2020 年刚推出的英伟达深度神经网络训练和推理芯片 A100,它的面积大约是 800 多平方毫米,这并不是说他只想做这么大,他其实可以做更大。

但是 826 平方毫米是现在光刻机能够光刻出来芯片最大极限,也就是到了单个芯片大小的极限。同时,他为了把更多存储和计算放在一个板卡上,现有产品是把 7 块电子芯片同时放在一个很大的封装里面做联合计算,这样的话它的能耗可达到 450W。

另一个案例,2019 年,美国初创公司推出一款计算芯片,其面积大约是 46225 平方毫米,芯片就像你的笔记本电脑那么大,它的能耗是 20000W,和 5 个电磁炉的能耗或者产生的热量差不多大。当然这并不是说明未来芯片就会长这样,但至少从某种程度上,能代表整个电子行业对于高性能算力的需求、以及它大的发展方向,概括来说就是已经慢慢接近物理极限。

我经常把芯片设计比喻成城市发展或城市规划,现在的芯片越做越大。大家去想 500 年前的城市,想把 500 年前 100 万的城市变成 1000 万人口的城市是非常困难的,因为会受限于几个基础建设方面的问题,一个是城市之间的交通,如果你用传统马车、步行甚至汽车,如果全都是平面道路,就没有办法满足交通和供应需求。

另外,每个楼房如果还是 500 年前的一层楼两层楼,要想支撑起更大的城市体系也非常困难。

什么是最需要的?最需要的是从基础上能帮助传统电子芯片进行下一代升级的技术,而光计算和光子芯片是最适合下一代计算芯片基建技术的选择。

首先,光可以有效代替电来解决高通量和交通问题。光纤通信已经用了几十年,光在传输信号上的能耗、延时和通量都远远好于电子。另外在单个计算上,用光来做计算不需要很多逻辑门的推理,它本身是一个完全被动的过程,所以能大大节约计算层面的能耗。

光芯片对普遍人来说是一个比较陌生的概念,提到光可能大家想到的是照相机和透镜这些非常大的系统。集成光子技术是最近 10 年以来蓬勃发展的技术,主要概念是在生产电子芯片的硅机上制造非常微小的微米级别光学器件,这样就可在一个芯片上集成成千上万的光子元器件,并让电子元器件非常好地结合在一起使用。

相关技术已经慢慢接近成熟,曦智科技已经在 2019 年成功推出了全球首款光子计算芯片原型板卡。公司目前计划流片的产品级光子计算芯片,单个芯片集成 3000 个光子元器件,比之前光通信光子芯片多出 100 倍,并且这已经是被现有制程和产业链所接受的技术。

曦智科技的技术创新点主要是用光芯片来加速 2/3 的计算要素。任何一个计算系统主要有三块计算要素:第一部分是数据处理,我们用光代替电芯片来做大部分数据处理,即大数据线性计算;第二部分是数据传输,传输包括一块芯片上的数据传输、芯片之间的数据传输。想象一下城市里常见的城际高铁系统、高速路系统和高架系统,只有具备城际和城际之间的高速系统,城市才能做到更大,才能有周边的卫星城。

曦智科技现在暂时不做的是第三个要素即存储系统,我们觉得整个计算体系里,存储系统仍旧是最核心的部分,所以我们的产品是光和电的结合解决方案。

光的计算技术来源于我在 MIT 学习期间从 2013 年到 2017 年四年的研究成果,当时也发过论文。

它的概念是把传统电子信号转成光信号,让光信号通过光子芯片,并且控制这些光之间的干涉,当这些光相互干涉时、以及这些数字发生计算时,整个计算时间就是光线通过芯片的时间——0.1 纳秒到 0.5 纳秒之间。这个时间是现在电子芯片来做同样大的矩阵乘法的 1%,在速度和延时上有非常大的提升。

 

此外,我们也做光子片与片之间的高速互联,用光来做数据传输本身是非常合理的解决方案。而我们已经在技术上实现了做同样距离的数据传输,比起电芯片可在能耗上节约 10 倍,这样能更大地润滑芯片计算。

曦智科技的主要技术方案,是在光的计算和光的传输上,把它做到非常高集成,并且让光子芯片去辅助现有数字电子芯片,从而加速整体运算过程。

在曦智科技的芯片上,光子网络、光子网络的计算单元会以光速在整个芯片上进行传输和数据的交互。此外,光芯片上还会再叠加一个或几个数字电子芯片,这样在电子芯片上会继续做存储和简单的逻辑运算以及非线性运算。当然,我们还会有几个光芯片来给整个光子芯片提供光源。

最后封装下来,可能跟现在板卡上的芯片差不多,但是相对其他同类数字芯片,数字运算能力可以得到 5 倍甚至 10 倍的算力提升。

有了上述愿景以后,我们非常快地投入到光计算商业化,我们也是全球目前跑的最快的一家光计算公司。公司在 2017 年成立,现在已经是第四个年头,从互联网角度来看已经是一个比较老的公司。但是从芯片行业来看,我们还是处于比较早期阶段的公司。

2019 年,曦智科技完成了第一个完整板卡系统,并验证了神经网络算法。现在我们完成了第二轮融资,总共超过 7000 万美元,我们第一款产品应该会在明年推出。

同时,我们有 100 多位工程师和研究人员,主要集中在美国和中国,其中十多位员工是来自 MIT 的科学家和工程师,70% 的芯片设计师拥有十年以上业内工作经验。做这样一件用新技术来推动老产品的事情,需要创新的年轻团队和有经验的数字芯片设计团队一起来做,我们在团队规模上也达到了可以做第一个产品的规模。

过去几年,我们主要做两件事情,一是把光芯片的集成做得越来越大,曦智科技把矩阵从最早的 4×4,做到接近 100×100 的矩阵规模,并把光和电芯片做了非常紧密的结合,这样电芯片可以叠在光芯片上来做整个系统的运算。

大家可以把曦智科技的技术想成是一家做高算力、低能耗的下一代芯片公司,这种芯片可广泛应用于数据中心,能做人工智能或大数据相关的机器学习运算,应用场景包括自动驾驶、互联网、智慧城市、金融等各个方面。同时也会做比较完善的软件栈架构来帮助客户在使用芯片时能够感受不到他是用在光在做。也就是光芯片和电芯片的整个接触点和结合点都和现有数字芯片类似。

在公共服务领域,曦智科技也有非常多的切入点,目前在和几个一线城市推出用芯片去做智慧交通、智慧港口、智慧安检等一系列大数据的应用场景。

除 AI 以外,光子芯片的应用场景不仅在机器学习上,未来很多科研包括对大气、地理、新材料和药物的研发,都可以通过算力更高的光电混合芯片来提高现有研发进度,我们最近也有论文发在 Nature 上来讲怎么用光子芯片来做药物研发。

曦智科技现在也有幸和一些全球领先的企业产生成功的商业合作,光子芯片代表了一个能够更快产业化的技术方向,其中一个主要原因是光子芯片并不是特别依赖制程,并且技术不受限制。因此,我们可以更快地用 28 纳米的电子芯片做出 7 纳米电子芯片的效果,正因此曦智科技最近得到了中科院的重视,并且在落地一些非常重要的项目。