AI ASIC 市场的「异类」：Tenstorrent 与 Tensordyne 的非对称战争

Hashrate Index 的 AI ASIC 系列出到了第四篇。前三篇分别梳理了 Broadcom/Marvell 这类「设计赋能者」和 Groq/Cerebras/Etched 这类「NVIDIA 正面挑战者」。第四篇的标题很有意思——用了 Architectural Outliers（架构异类）这个词。Tenstorrent 和 Tensordyne 的确不是 NVIDIA 的正面竞争者，但各自在完全不同的维度上下了重注。

一张图看懂五家独立 AI 芯片公司

Hashrate Index 的 2×2 矩阵把五家公司按架构激进程度和商业成熟度两个轴排开：

激进 × 已验证：Groq（被 NVIDIA 收购）、Cerebras（Wafer-Scale，2026 年 5 月 IPO 目标）、Etched（Transformer 硬编码，$5B 估值）
激进 × 未验证：Tensordyne（对数数系，尚在仿真阶段）
保守 × 已验证：Tenstorrent（RISC-V，$150M 签约合同）

有意思的是，最容易获得市场关注的公司在左上角——高估值、大额收购、IPO 目标。但五家公司中有两家不在那里，而它们的战略逻辑恰恰值得单独理解。

Tenstorrent：用开源 IP 绕过 HBM 战争

如果只看芯片，Tenstorrent 是五家公司里最「不激进」的——RISC-V 核加 Tensix AI 加速器，GDDR6 显存而不是 HBM，三星代工而不是 TSMC 一家独供。但它的激进在别处：商业模式上它是唯一一家以开源 IP 授权为核心的公司，而不是靠卖成品芯片。

Jim Keller 的牌

Jim Keller 的履历不需要多介绍——DEC Alpha、AMD K7/K8/Zen、Apple A4/A5、Tesla FSD、Intel SVP。他带到 Tenstorrent 的，不只是芯片设计能力，更是一种对半导体供应链的结构性判断。

Keller 公开说过一个观点：「和 NVIDIA 在 HBM 上竞争是结构性的劣势——NVIDIA 采购最多 HBM，有最大的成本优势和最深的供应关系。」所以 Tenstorrent 选择了 GDDR6 + 片上 SRAM（Blitz Mode），故意绕开 HBM 瓶颈。这个策略在训练市场上行不通，但 Tenstorrent 的目标本来就不是前沿训练。

产品矩阵

Blackhole 芯片（已出货）：

120 Tensix 核，32GB GDDR6，300W TDP
16 颗大 RISC-V 核（非 ARM）
Blitz Mode：片上 SRAM 直通，消除 HBM 往返延迟
QSFP-DD 800G 互联

Galaxy 系统（2026 年 5 月 TT-Deploy 活动后批量出货）：

32 芯片/Galaxy，4 Galaxy/Quad，多 Quad 级联成超算集群
纯以太网 Mesh 拓扑——不需要交换机，芯片直连芯片
宣称 DeepSeek-R1-0528 671B 推理吞吐 350+ t/s/u
视频生成（Wan 2.2 A14B）比 GPU 快 10 倍

TT-Ascalon RISC-V CPU：

64 位乱序超标量，RVA23 兼容
开源 BOOM/Ocelot 组件
IP 授权模式：Tenstorrent 授权 RTL 源码——不是黑盒 IP，而是可以修改的电路描述。这比 ARM 的授权模式灵活一个数量级。

客户和商业化

LG 电子（$150M 合同）：AI SoC 用于智能家居和视频处理
现代/起亚：车载 AI 协处理器
三星：既是投资方也是代工厂
Razer：CES 2026 展示紧凑型 AI 加速器
Infinia Technologies：主权 AI 基础设施
估值：$32 亿（2024 年 12 月 D 轮，比 D 轮前翻倍）
Jeff Bezos + 三星联合投资超 $7 亿

Tenstorrent 的商业逻辑很清晰：切那些超大规模云厂商不做的市场——边缘 AI、汽车、中型企业，以及开放 IP 授权本身。这些市场不直接和 hyperscaler 内部 ASIC 竞争，但作为一个独立芯片公司的生存空间足够大。

Tensordyne：对数域的豪赌

Tensordyne 是五家公司里最极端的存在。它的架构赌注在芯片行业属于「要么颠覆一切，要么零」的级别。

Pareto 数系（对数计算）

核心观察：矩阵乘法——神经网络最主要运算——在对数域上退化为加法。log(a × b) = log(a) + log(b)。加法器电路比乘法器小得多、功耗低得多。释放的芯片面积用来堆更多 SRAM 缓存（Tensordyne 宣称是 GPU 的 6 倍）。

但代价是：加法本身在对数域会变复杂。Tensordyne 用的是专有的近似算法，精度宣称 99.9% 以上。

宣称的性能数字

全部基于仿真，硅片尚未验证：

每 token 功耗 = NVIDIA GB200 NVL72 的 1/8
每 token Capex = 竞品的 1/3
单机架 3M tokens/s，$0.02–0.05/1M tokens
风冷运行——不需要液冷基础设施
HBM3e 内存，any-to-any 互联

如果这些数字在硅片上成立，这将是 AI 推理经济学的阶跃函数变化。问题在那个「如果」上。

风险剖面

这家公司原名 Recogni，2017 年成立，最初做汽车边缘推理。2025 年 9 月改名 Tensordyne，全面转向数据中心推理，同时拿到了 IDCA G2 认证（企业 AI 平台运营就绪）。至今仍处于 pre-silicon 阶段。

CEO Marc Bolitho 在 2025 年底表示 tape-out「即将进行」，硬件目标 2026 年年中
声称超大规模云和 neo-cloud 公司「排队等待」beta 测试
没有任何公开确认的署名客户

对数数系架构在学术界研究了数十年，从未被数据中心芯片采用。Tensordyne 面临的不仅是技术风险，还有商业信任问题——beta 测试兴趣不等于采购订单。

但话说回来：8 倍能效优势如果成立，对受电力限制的数据中心来说是决定性的。特别对那些比特币矿场想转型 AI/HPC 的运营商——Tensordyne 的风冷 + 低功耗特征恰好匹配存量矿场基础设施。

两家的共同点：避开 HBM 军备竞赛

Tenstorrent 用 GDDR6，Tensordyne 虽用 HBM3e 但宣称需要更少模块。Groq 纯 SRAM，Cerebras 晶圆级 SRAM。五家独立 AI 芯片公司中，没有一家押注 HBM 竞争——这本身就说明问题。

HBM 由 SK 海力士、三星、美光三家垄断，NVIDIA 吃掉大部分产能。任何独立芯片公司想在 HBM 上正面竞争，都是在用别人的供应链打别人的战争。这不是技术问题，是经济学问题。

行业启示

Tenstorrent 和 Tensordyne 代表了独立 AI 芯片公司的两种生存策略：

差异化市场（Tenstorrent）——不争数据中心顶峰，争边缘、汽车、企业中间层。用开源 IP 建立生态位。
差异化架构（Tensordyne）——不争现有架构优化，争全新数系的跃迁。一步到位的技术赌注。

Hashrate Index 系列的 Part 5 将给出综合判断：NVIDIA 对这些独立挑战者群体的战略回应，以及整个投资格局的结构性结论。拭目以待。

㕛木 Youmoo