x86的竞争对手可能是:Centaur CNS x86 8核CPU Review

Today, we’re taking a look at a very unique product which unfortunately will never be released – Centaur’s CHA SoC with 8 x86 CNS Cores. Many folks might not be familiar with Centaur. Here’s a quick background:

Centaur was founded in 1995, and created many x86 CPUs such as the WinChip processors in the 90s and many of VIA’s chips in the 2000s such as the VIA’s C3, C7, and Nano CPUs. They were one of the first companies to debut hardware encryption acceleration with the VIA C7 CPU, 4 years before Intel & AMD implemented AES-NI. Additionally, Centaur’s CPUs are the foundation for the designs of ZhaoXin‘s x86 CPUs.

Architecture Overview

资料来源: Wikichip

The design team which created Centaur’s CNS CPU was comprised of only 100 persons from Austin, Texas. The CPU is manufactured on TSMC’s 16nm process and is 194mm2 in size. It has eight x86 CPU cores with quad-channel DDR4 memory, 44 PCI-e lanes, and limited AVX-512 support. Clock speeds on the pre-release CPUs vary from 2.0 to 2.5ghz. This CPU was initially planned for release in 2020.

If you look on other websites discussing Centaur’s CPU, you might see it referred to as “CHA公司” instead of “中枢神经系统“. That’s because “CHA” is the name of the SoC, whereas the x86 cores are “CNS”. The internal codename for this project was simply “NCORE公司“.

The overall IPC of the CNS Core is similar to Intel’s “Haswell” architecture, but it achieves this without a micro-op cache. The core-to-core latency is fairly good, though it is a bit worse than the P-core to P-core latency of Intel’s i5-12600k.

这种CPU的“杀手级功能”是NCore,这是一种AI协处理器,对于INT8来说,其峰值性能为20个TOP。对于那些感兴趣的人,Centaur在 Reddit上的AMA

资料来源: Centaur技术

还有两个公开的视频,半人马座的首席人工智能架构师格伦·哈里(GlennHarry)在其中概述了芯片的功能。
以下视频从整体上介绍了CHA SoC:

这段视频专门介绍了NCORE AI协处理器

薯片和奶酪

Chips N Cheese也在他们的三篇文章中介绍了CHA SoC,看看吧!

检查Centaur CHA的死亡和实施目标

Centaur CHA可能尚未完成的双套接字实现

通过第4部分–深入了解Centaur的最后一个CPU核心:CNS

CHA001主板

这是一个预发布的主板,因此它有一些在典型的消费类主板中找不到的怪癖和不寻常的功能。

在主板左侧,主板电源连接器上方有两个调试连接。第一个标记为“JTAG\U VIA\U CONN”-我假设这是一个用于调试的VIA特定连接。上面的端口是标准XDP(英特尔扩展调试端口)连接。

在右侧,您有支持音频、以太网、7x USB端口、PS/2连接和串行端口的IO面板。如果您需要两个串行端口,IO面板后面会有一个用于第二个端口的标头。再往上看,我们有一个经典的CD音频标题。

移动到主板的顶部,我们有一个dip开关,一个通过JTAG直接编程的CPLD连接,3个2极dip开关,一个TPM连接,奇怪的是,一个USB-C连接,我认为是用于调试目的的。

虽然SATA端口旁边的M.2插槽支持PCI-e 3.0,但PCI-e插槽旁边的M.2插槽仅支持PCI-e 2.0速度

BIOS和超频

Centaur系统的BIOS来自AMI。这个BIOS中塞满了调整系统的各种方法,如果我想的话,我不可能涵盖所有这些方法。

从下面显示的菜单中,我了解到CPU没有设置的存储箱。

但是,在CPU设置中,您可以手动设置箱子。最好的设置是在1.1v时为2.5ghz,但是我的设置在这些设置下不稳定–如果我想在不稳定的情况下运行2.5ghz,我必须增加电压。
我试图在2.6ghz下运行CPU,但无论施加多少电压,它都保持不稳定。

BIOS还有一个有趣的选项,称为“Conclader”

此选项允许主板将CPU架构伪装为程序,如果程序不想工作,因为它无法识别CPU,或者因为程序利用 不公平的CPU调度程序.

令我惊讶的是,这块主板的某些部分采用了兆鑫技术。SATA和USB由兆鑫ZX-200芯片组处理。车载音频也是赵欣制造的。

怪癖、bug和怪癖

作为预发布硬件,我遇到了一些怪癖。

1) 当我加载时 Crysis重新录制,它警告说CPU不受支持,但在其他方面没有问题。

2) 我尝试运行Cinebench R15,因为有很多基准测试可以使用旧CPU运行R15,其单核性能类似于Centaur的CNS,但是 程序无法加载. 我尝试了可从Guru3D下载的版本,以及HWBot基准测试中包含的版本,但都未能启动该程序。

3) 通过下载游戏时 水蒸气,如果其中一个打开了另一个程序(如Mozilla Firefox),下载速度会在几分钟内急剧下降,直到另一个程序完全加载。这只发生在Steam中——在运行育碧连接、GOG、Origin或Epic的游戏启动器时,我无法再现这种怪癖。

4) 我原本打算进行测试 RPCS3 在启用AVX-512与禁用AVX-512的情况下测试仿真性能,但程序在测试时编译SPU缓存时总是挂起 恶魔的灵魂.

5) HWBOT的 基准测试 不认识CPU,因此我无法通过他们的基准测试程序提交分数。我可以手动提交分数–您可以在 https://hwbot.org/user/albert.thomas/#My_Submissions

系统配置

中央处理器Centaur CNS,8芯@2.5ghz
主板CHA0001
CPU冷却器MSI MEG芯液S280 液体冷却器–先前审查 在这里
内存GSKill Trident 3466设置为3200 JEDEC速度
GPUZotac Gaming Nvidia RTX 3060ti
固态硬盘500gb Sabrent火箭4
500gb西部数字SN550
计算机机箱DeepCool CK560WH –以前的审查 在这里
PSUDeepCool PQ1000M

基准测试

为此,我只能对CNS x86内核进行基准测试。我希望能够测试NCore,但这些驱动程序尚未公开。

需要注意的一点是:半人马座CNS核心的设计 四通道存储器 考虑到支持,我只有2个DDR4棒可用,将支持限制为 双通道配置. 这一点很重要,因为任何内存受限的工作负载的性能都会低于预期。

CPU-Z

我选择在CPU-Z中将参考CPU设置为Ryzen 1600,因为8c/8t与6/12 CPU的性能最为相似。在这里的多线程基准测试中,R5 1600的性能提高了约40%。然而,它的时钟速度也提高了44%。考虑到时钟速度,Centaur CPU在本测试中表现良好。在此基准测试中,Intel的i7-7700k单核性能得分为492分,几乎是Centaur的CNS核的两倍。在多线程测试中,i7仍然领先,但没有那么引人注目——2648对2206。

对于那些感兴趣的人,下面是一个经过验证的CPU-Z结果: https://valid.x86.fr/910tkn

影椅R23

在这一结果中,Centaur CPU的单核性能并不令人印象深刻。仅以552分的成绩位居榜单倒数第二,仅优于Westmile Xeon。这不是最好的比较,因为此图表中的其他CPU以不同的时钟速度运行。如果我们将CNS的结果与Ryzen 1700x进行比较,1700x的时钟速度提高了56%,但性能提高了73%。

4141分的多核结果令人满意,与单核得分相比,比例为93.8%。在这种情况下,Ryzen 1600 CPU的得分通常在6400分左右。如果考虑到Centaur CNS和Ryzen 1600之间的时钟速度差异,这里的性能很好。

AIDA64 GPGPU

在查看这些结果之前,请记住GPGPU的结果受内存的影响,因此,除非与四通道内存配对,否则半人马座CNS的性能将不佳。我的设置运行双通道内存,所以请记住这一点。

对于AIDA64 GPGPU结果,我发现 Ryzen 3600和Ryzen 5600在/r/AMD上的比较结果 发布人 /与Alex一起喝咖啡

这里有一些有趣的结果。在所有整数IOPS测试中,CNS CPU的性能均优于Ryzen 3600。与Ryzen 3600相比,Ryzen 5600在这些方面有了巨大的改进,因此它在所有这些指标上都优于CNS,但CNS在64位整数IOPS方面仍然非常接近,CNS CPU上的IOPS为69.53 GIOPS,而Ryzen 5600上的IOPS为71.87 GIOPS。

尽管受到双通道内存的限制,CNS CPU在内存写入操作方面仍优于Ryzen 3600和Ryzen 5600。这仅适用于单芯片Ryzen CPU–5900x和5950x显示的性能约为5600x内存写入结果的2倍。

Geekbench 5

https://browser.geekbench.com/v5/cpu/15315467

Ryzen 1600在单核性能方面领先半人马CPU 55%,但在多核性能方面领先下降到31.8%,这表明半人马CPU在此基准测试中的扩展性更好。考虑到Ryzen更高的时钟速度,这是一个不错的性能。

电晕1.3

对于此处的比较数据,我使用了Hardware Unbox/Techspot提供的数字 https://www.techspot.com/review/1447-amd-ryzen-3-1200-1300-performance-preview/page2.html

在这一基准测试中,Centaur CNS的表现比Intel的i5-7600k好得多。然而,Ryzen 1600x的结果抹杀了CNS的性能——几乎用了一半的时间完成了任务!这是一个比时钟速度更大的利润。

7-zip压缩/解压缩

对于这些比较结果,我来源 7拉链 1700x数字和 开放基准测试。组织机构 对于i5 6500结果。

用户基准测试

一般来说,我不愿意将UserBenchmark纳入我的结果中,因为它们存在偏见和戏剧性,但这对于某些比较是有用的。

借助UserBenchmark,Ryzen 1600在单线程负载方面领先44.4%,在四核负载方面领先35.5%,在大规模线程负载方面领先54.6%,总体性能优势为44%。

Y型破碎机

Y-Cruncher的结果是,我们实际上看到CNS CPU的性能优于Ryzen 1700x,这非常令人印象深刻。这很可能是因为Y-Cruncher支持AVX-512,而Centaur CNS支持AVX-512。

Y-Cruncher的Ryzen 1700x性能数据来源于TechReport: https://techreport.com/review/31366/amds-ryzen-7-1800x-ryzen-7-1700x-and-ryzen-7-1700-cpus-reviewed/

游戏

没有比游戏更好的方法来测试支持AVX-512和AI处理器的未发布CPU了,对吧?毕竟,它真的能运行Crysis吗?!开玩笑的是,我认为在半人马座平台上测试一些游戏会很有趣。理论上,它的性能应该类似于低时钟i7-9700k。

我做的这个游戏测试与以前的评论有点不同,我不是比较多个CPU的结果,而是想看看Centaur的CNS内核在游戏中能保持什么样的性能。我不认为对Ryzen或Intel CPU进行深入测试会非常有用,考虑到时钟速度和IPC的差异,几乎可以保证任何第一代Ryzen CPU在游戏中都会优于此。

对于下面的所有结果,我使用Nvidia的影子游戏录制了游戏。这对总体性能影响不大(性能损失5-10%)。

Crysis重新录制

让我们从一个有人一定会问的标题开始。它能跑Crysis吗?嗯,游戏引擎认为它不能。

然而,考虑到它的低2.5ghz钟速,它实际上运行Crysis相当好——这绝对是我认为可以玩的体验。

厄运(2016)

我原以为2016年末日会在这个系统上正常运行,但它实际上表现得相当不错。帧速率平均约为120-130fps,最低为80年代。与现代CPU相比,它的性能相对较弱,现代CPU能够维持稳定的200 fps帧速率。

奇怪的旅

在这个游戏中,半人马CPU的性能甚至比它在《末日》中的表现还要好。最低帧速率约为107fps,平均约为130-140。

赛博朋克2077

在许多场景中,半人马在《赛博朋克2077》中的表现都是可以接受的。然而,在驾驶场景中,尤其是在战斗中,帧率会受到一些影响。这仍然是我认为“可玩的”,但并不舒服。

远距V

我想测试FarCry V,因为它受到单线程性能的限制而臭名昭著。演出有多糟?好吧,让我们这样说吧——它满足了我认为可玩的最低标准,而且内核的负载相对均匀。然而,由于单线程负载峰值保持在80%左右,一些因素阻碍了内核的充分利用。

刺客信条:奥德赛

从帧速率来看,这个标题可能看起来是可以玩的,但在AC:O中,半人马座的CPU上的微动使游戏变得很痛苦。微动口吃在游戏录制中不太明显,但如果你观看视频的结尾,其中记录了内置的基准,那么在这个录制中就更容易注意到。

总结与思考

我非常喜欢测试这个预发布系统。这让我想知道VIA决定向Centaur的德克萨斯州奥斯汀团队投入更多资源的原因。尽管它的时钟速度相对较低,但这种CPU在大多数游戏中都能提供“可玩”的游戏性能,总体上与非游戏基准中时钟不足的Ryzen 1600相似。

我希望我能够测试NCORE,但它的驱动程序基本上是不可能获得的。看来NCore的专利实际上归赵欣所有——我们可能会在他们未来的产品中看到这一点,谁知道呢——也许这些未来CPU的驱动程序将与Centaur的CHA SoC配合使用,我们将能够测试这些AI核的性能。

真正让我惊讶的是,即使没有使用NCORE的能力,也有一些特殊的情况,这种低时钟CPU与时钟更高的Ryzen CPU竞争,或者实际上优于后者。

作为一项协议的一部分,Centaur德克萨斯团队的员工现在由Intel雇用,Intel为此支付了1.25亿美元。我不禁想知道,CHA SoC给英特尔留下了怎样更深刻的印象?大约100名员工组成的团队取得了相对良好的x86性能,或者说NCore的性能比英特尔的解决方案更高。

喜欢吗?花点时间支持阿尔伯特·托马斯在帕特伦的比赛!
崇拜的电视