英特尔的神经形态芯片 Loihi 是在 2018 年提出的,使用 14 纳米制程。随着英特尔在制程节点的突破,Loihi 2 代终于在今天发布了。这是对初代芯片的重大升级,其解决了神经形态芯片的诸多重大问题,更重要的是它采用了 Intel 4——英特尔下一代 EUV 工艺的预生产版本(7nm)。
近年来,随着 CPU 技术发展的放缓,专用计算机芯片领域的发展越来越受到重视,例如 GPU 和专用内存芯片。每一种芯片都针对特定的任务量身定制。神经形态芯片也是这一趋势下的产物。
鸟和无人机的算力对比,这就是常规计算机架构和「神经形态架构」的区别。
今天,英特尔宣布了在神经形态计算领域的重大更新:第二代神经形态研究芯片 Loihi 2,以及用于开发神经启发应用的开源软件框架 Lava。
此外,英特尔提供了两个基于 Loihi 2 的神经形态系统ーー Oheo Gulch 和 Kapoho Point,通过云服务免费提供给英特尔神经形态研究社区 (INRC) 的成员,或在 GitHub 平台提供给 Lava 成员。
神经形态计算借鉴人类神经系统科学领域的进展,开发出功能更类似大脑的芯片,追求在一系列边缘应用中实现能效、计算速度和学习效率的数量级提升,包括从视觉、语音和手势识别到搜索检索、机器人和约束优化问题。英特尔和一些合作伙伴已经证明了神经形态芯片在机械臂、人造皮肤和嗅觉传感等方面的应用。
新一代神经形态芯片 Loihi 2
Loihi 2 结合了第一代 Loihi 芯片三年经验,并建立在英特尔工艺技术和异步设计方法的进步之上。每颗芯片最多可封装 100 万个「神经元」,采用预生产版 Intel 4 工艺制造的 Loihi 2 比第一代 Loihi 快 10 倍,资源密度提高了 15 倍,且能效更高。
英特尔神经形态计算实验室总监 Mike Davies 表示:「第二代芯片极大地提高了神经形态处理的速度、可编程性和容量,扩大了在功耗和时延受限的智能计算应用上的用途。英特尔正在开源 Lava,以满足在实践中对软件融合、基准测试和跨平台合作的需求,并加快商业可行性的进程。」
两代 Loihi 芯片在某种程度上很相似,但更重要的是不同之处:
都是 128 个神经形态核心,但第二代芯片中的每个核心都包含 8 倍的神经元和突触。128 个核心中的每一个都有 192 KB 的弹性内存,而上一代芯片的每个核心在运行时是固定的;
每个神经元可以根据模型分配到多达 4096 个 state,之前的限制是只有 24 个。现在的神经元模型类似于 FPGA,是完全可编程的,提供了更高的灵活性。
第一代 Loihi 中,神经元和尖峰网络在二进制事件中传递数据。新一代 Loihi 使用 32 位有效载荷对这些事件进行分级,为片上计算提供更大的灵活性。比如,使用芯片上新的开发 / 调试功能实时监控这些事件,而不是暂停 / 读取 / 播放;更好地控制动态更改计算工作负载,例如扇出压缩、权重缩放、卷积和广播。
Loihi 2 最大的改进之一是连通性。第一代 Loihi 使用自定义的异步协议来创建大型的 2D 神经元网络,而 Loihi 2 可以根据需求配置使用多种协议,也可以在 3D 网络中使用。这意味着, Loihi 2 不仅仅是一个芯片,而是一个具有相同神经元架构但面向特定用例的不同连接选项的芯片系列。其可以与板载消息压缩加速器结合使用,使芯片对芯片带宽增加了 10 倍。
Intel 4 是原 Intel 7nm 制程的正式架构,与以往的制程技术相比,Intel 4 制程节点采用的极紫外光刻(EUV)技术简化了布局设计规则。
这是否意味着 Intel 4 已准备好投产?不一定,但确实已经有芯片实物了。许多 Loihi 2 列出的基准测试提到了「预期的模拟硬件结果」,但是一些模拟是在真实的芯片上完成的,英特尔也表示现在真正的芯片是部署在云上的,EUV 和 Intel 4 预计要到 2022 下半年才会真正提高产量。
图片来自 AnandTech。
英特尔表示,Loihi 2 和 Lava 为研究人员开发并塑造新的神经启发应用提供了工具,用于实时处理、问题解决、适应和学习:
更快、更通用的优化:Loihi 2 更出色的可编程性将帮助解决更广泛的艰难优化问题,包括从边缘到数据中心系统的实时优化、规划和决策。
持续学习和关联学习的新方法:Loihi 2 改进了对高级学习方法的支持,包括了各种反向传播算法(深度学习的主力算法)。这扩大了适应性和数据高效学习算法的范围,使低功耗设备能支持这些在线学习算法。
可通过深度学习进行训练的新型神经网络:Loihi 2 中的完全可编程神经元模型和广泛的脉冲信息传递,为各种可在深度学习中进行训练的新型神经网络模型打开了大门。早期的评估表明,与在原始版本的 Loihi 上运行的标准深度网络相比,在准确性没有降低的情况下,Loihi 2 上每次推理的运算次数减少到 60 分之一以下。
英特尔神经形态计算实验室总监 Mike Davies 表示,Loihi 2 等芯片擅长于处理赋予计算机感官(例如视觉和嗅觉)的任务。因为效率很高,神经形态芯片似乎非常适合电源有限且不受传统计算机网络束缚的移动设备。
全新的 Lava 软件框架
与此同时,英特尔还推出了 Lava 软件框架。神经形态系统的主要构建组件之一是计算,编写软件来使用这种架构往往很困难。
Lava 软件框架满足了神经形态研究社区对通用软件框架的需求。作为一个开放、模块化、可扩展的框架,Lava 将允许研究人员和应用开发人员在彼此取得的成果上进一步开发,并集中到一组通用的工具、方法和函数库中。
同时,Lava 能够在跨越传统和神经形态处理器的异构架构上无缝运行,实现跨平台执行以及与各种人工智能、神经形态和机器人框架的互操作性。开发人员无需使用专门的神经形态硬件即可开始构建神经形态应用,并且可以为 Lava 代码库做出贡献,包括将其移植到其他平台上运行。
部署在英特尔云服务中的第一块 Loihi 2 芯片,其搭载的板卡是 Oheo Gulch,它的造型和普通的 PCIe 板卡类似,使用 FPGA 来管理大量 IO。
未来,英特尔还将生产一款名为 Kapoho Point 的 4x4 英寸版卡,其上含有 8 个神经形态芯片,旨在提供更高性能并集成到更大的机器中。
Loihi 2 预计会随着英特尔 DevCloud 供研究合作伙伴使用,将在未来一两年内进行本地化研究、合作部署。
参考内容:
https://www.anandtech.com/show/16960/intel-loihi-2-intel-4nm-4
https://www.science.org/content/article/new-brain-inspired-chips-could-soon-help-power-autonomous-robots-and-self-driving-cars