Etched 估值达 50 亿美元且 AI 芯片销售额突破 10 亿美元

人工智能硬件领域的格局正在发生剧烈变化。长期以来，英伟达（Nvidia）凭借其 GPU 在大语言模型（LLM）的训练和运行中占据了近乎垄断的地位。然而，一家名为 Etched 的初创公司正带着一种激进的技术路线脱颖而出。近日，Etched 的估值已达到惊人的 50 亿美元，这主要得益于其旗舰芯片 “Sohu” 超过 10 亿美元的预订订单。这一里程碑事件标志着行业的一个重要转向：从通用型 GPU 向专门针对 Transformer 架构优化的专用集成电路（ASIC）过渡。

对于使用 n1n.ai 等平台的开发者和企业来说，这些硬件层面的突破并非遥不可及的实验室数据。它们代表了未来 LLM API 的稳定性、成本效益和响应速度。随着硬件效率的提升，通过 n1n.ai 获取高性能模型的成本预计将大幅下降，而吞吐量将呈指数级增长。

Sohu 芯片：将 Transformer 架构“刻”进硅片

与英伟达的 H100 或 B200 不同，后者的设计初衷是处理各种计算任务（从图形渲染到各种神经网络架构），而 Etched 的 Sohu 芯片是一款 ASIC。它是专门为 Transformer 架构（即 GPT-4、Llama 3 和 Claude 3.5 Sonnet 等模型的基础技术）量身定制的硬连线芯片。

通过将 Transformer 的逻辑直接“烧录”到硅片中，Etched 消除了通用可编程性所需的额外开销。其结果是，该芯片在处理 Token 时的速度和能效比是通用 GPU 无法比拟的。根据 Etched 的官方数据，在执行推理任务时，一台 Sohu 服务器可以取代数十台英伟达 H100。

深度对比：Sohu vs. 英伟达 H100

特性	英伟达 H100 (GPU)	Etched Sohu (ASIC)
架构	通用并行计算	仅限 Transformer 的 ASIC
灵活性	高（支持所有 AI 模型）	低（仅支持 Transformer）
吞吐量	基准 (1x)	Llama 70B 模型下最高提升 20 倍
延迟	< 50ms (平均)	< 5ms (目标)
单 Token 成本	标准	显著降低

为什么 50 亿美元估值和 10 亿美元销售额至关重要？

这 10 亿美元的已签约合同表明，超大规模云服务商和大型 AI 实验室正在积极寻找“英伟达税”的替代方案。GPU 的短缺导致提供 LLM API 的公司面临极高的运营成本。通过锁定这些订单，Etched 证明了市场对“只做推理这一件事，并做到极致”的硬件有着巨大的需求。

对于使用 n1n.ai 的开发者社区而言，这意味着他们通过 API 调用的 LLM 底层基础设施正变得更加多样化。当你通过像 n1n.ai 这样的统一 API 聚合器访问模型时，你无需重写集成代码，即可享受到这些新硬件带来的后端优化红利。

技术权衡：灵活性与性能的博弈

Etched 面临的最大风险是“架构锁定”。如果 AI 研究界从 Transformer 转向新的架构（如状态空间模型 SSM 或 Mamba），Sohu 芯片可能会变得毫无用处。然而，Etched 赌的是 Transformer 将成为 “AI 领域的 TCP/IP”——一种在可预见的未来保持统治地位的基础标准。

开发者指南：如何为高吞吐量推理做准备

随着 Sohu 等专用硬件进入市场，开发者需要调整其实现策略，以充分利用提升的吞吐量。以下是如何使用 Python 通过高效率端点（如 n1n.ai 聚合的接口）构建请求的示例：

import openai

# 配置客户端，使用 n1n.ai 作为网关
client = openai.OpenAI(
    base_url="https://api.n1n.ai/v1",
    api_key="YOUR_N1N_API_KEY"
)

def get_high_speed_inference(prompt):
    try:
        # 利用由 ASIC 硬件优化的超高吞吐量后端
        response = client.chat.completions.create(
            model="llama-3-70b-instruct",
            messages=[{"role": "user", "content": prompt}],
            stream=True, # 流式输出对于低延迟体验至关重要
            extra_body={
                "optimization": "latency-first"
            }
        )
        for chunk in response:
            if chunk.choices[0].delta.content:
                print(chunk.choices[0].delta.content, end="", flush=True)
    except Exception as e:
        print(f"错误详情: {e}")

get_high_speed_inference("请解释 ASIC 硬件对大语言模型可扩展性的影响。")

专业建议：API 聚合的重要性

随着英伟达、Etched、Groq 和 Cerebras 之间的硬件战争升级，特定模型的性能会根据其运行的硬件环境而产生波动。开发者应避免被锁定在单一供应商的硬件栈中。通过使用 n1n.ai，你可以根据实时性能动态切换模型供应商，确保始终利用当前最有效的硬件和软件组合。

对 AI 初创企业的经济影响

这 10 亿美元的预订订单预示着“智能成本”即将大幅下降。如果 Sohu 能够兑现其性价比提升 20 倍的承诺，我们将看到一波此前因成本过高而无法实现的 AI 应用浪潮。例如：实时视频翻译、具有数千次迭代的复杂智能体工作流，以及超个性化的教育工具。

这些进步将通过 n1n.ai 等平台传递给用户，这些平台充当了尖端硬件与构建未来的软件开发者之间的桥梁。通过抽象化硬件层的复杂性，n1n.ai 确保了无论模型是在英伟达 GPU 还是 Etched ASIC 上运行，开发者的体验始终是无缝且高性能的。

总结

Etched 崛起至 50 亿美元估值，充分说明了行业对专用推理硬件的极度渴望。虽然英伟达将继续统治训练市场，但推理市场对像 Sohu 这样的 ASIC 来说是完全开放的。对于开发者而言，信号很明确：计算成本正在下降，AI 的速度正在提升。通过集成灵活的 API 层来适应这些硬件变革，是保持竞争力的关键。

获取免费 API 密钥，请访问 n1n.ai

参考来源：https://techcrunch.com/2026/06/30/nvidia-competitor-etched-hits-5b-valuation-1b-in-sales-for-ai-chip/