Etched 估值达 50 亿美元且 AI 芯片销售额突破 10 亿美元

作者
  • avatar
    姓名
    Nino
    职业
    Senior Tech Editor

人工智能硬件领域的格局正在发生剧烈变化。长期以来,英伟达(Nvidia)凭借其 GPU 在大语言模型(LLM)的训练和运行中占据了近乎垄断的地位。然而,一家名为 Etched 的初创公司正带着一种激进的技术路线脱颖而出。近日,Etched 的估值已达到惊人的 50 亿美元,这主要得益于其旗舰芯片 “Sohu” 超过 10 亿美元的预订订单。这一里程碑事件标志着行业的一个重要转向:从通用型 GPU 向专门针对 Transformer 架构优化的专用集成电路(ASIC)过渡。

对于使用 n1n.ai 等平台的开发者和企业来说,这些硬件层面的突破并非遥不可及的实验室数据。它们代表了未来 LLM API 的稳定性、成本效益和响应速度。随着硬件效率的提升,通过 n1n.ai 获取高性能模型的成本预计将大幅下降,而吞吐量将呈指数级增长。

Sohu 芯片:将 Transformer 架构“刻”进硅片

与英伟达的 H100 或 B200 不同,后者的设计初衷是处理各种计算任务(从图形渲染到各种神经网络架构),而 Etched 的 Sohu 芯片是一款 ASIC。它是专门为 Transformer 架构(即 GPT-4、Llama 3 和 Claude 3.5 Sonnet 等模型的基础技术)量身定制的硬连线芯片。

通过将 Transformer 的逻辑直接“烧录”到硅片中,Etched 消除了通用可编程性所需的额外开销。其结果是,该芯片在处理 Token 时的速度和能效比是通用 GPU 无法比拟的。根据 Etched 的官方数据,在执行推理任务时,一台 Sohu 服务器可以取代数十台英伟达 H100。

深度对比:Sohu vs. 英伟达 H100

特性英伟达 H100 (GPU)Etched Sohu (ASIC)
架构通用并行计算仅限 Transformer 的 ASIC
灵活性高(支持所有 AI 模型)低(仅支持 Transformer)
吞吐量基准 (1x)Llama 70B 模型下最高提升 20 倍
延迟< 50ms (平均)< 5ms (目标)
单 Token 成本标准显著降低

为什么 50 亿美元估值和 10 亿美元销售额至关重要?

这 10 亿美元的已签约合同表明,超大规模云服务商和大型 AI 实验室正在积极寻找“英伟达税”的替代方案。GPU 的短缺导致提供 LLM API 的公司面临极高的运营成本。通过锁定这些订单,Etched 证明了市场对“只做推理这一件事,并做到极致”的硬件有着巨大的需求。

对于使用 n1n.ai 的开发者社区而言,这意味着他们通过 API 调用的 LLM 底层基础设施正变得更加多样化。当你通过像 n1n.ai 这样的统一 API 聚合器访问模型时,你无需重写集成代码,即可享受到这些新硬件带来的后端优化红利。

技术权衡:灵活性与性能的博弈

Etched 面临的最大风险是“架构锁定”。如果 AI 研究界从 Transformer 转向新的架构(如状态空间模型 SSM 或 Mamba),Sohu 芯片可能会变得毫无用处。然而,Etched 赌的是 Transformer 将成为 “AI 领域的 TCP/IP”——一种在可预见的未来保持统治地位的基础标准。

开发者指南:如何为高吞吐量推理做准备

随着 Sohu 等专用硬件进入市场,开发者需要调整其实现策略,以充分利用提升的吞吐量。以下是如何使用 Python 通过高效率端点(如 n1n.ai 聚合的接口)构建请求的示例:

import openai

# 配置客户端,使用 n1n.ai 作为网关
client = openai.OpenAI(
    base_url="https://api.n1n.ai/v1",
    api_key="YOUR_N1N_API_KEY"
)

def get_high_speed_inference(prompt):
    try:
        # 利用由 ASIC 硬件优化的超高吞吐量后端
        response = client.chat.completions.create(
            model="llama-3-70b-instruct",
            messages=[{"role": "user", "content": prompt}],
            stream=True, # 流式输出对于低延迟体验至关重要
            extra_body={
                "optimization": "latency-first"
            }
        )
        for chunk in response:
            if chunk.choices[0].delta.content:
                print(chunk.choices[0].delta.content, end="", flush=True)
    except Exception as e:
        print(f"错误详情: {e}")

get_high_speed_inference("请解释 ASIC 硬件对大语言模型可扩展性的影响。")

专业建议:API 聚合的重要性

随着英伟达、Etched、Groq 和 Cerebras 之间的硬件战争升级,特定模型的性能会根据其运行的硬件环境而产生波动。开发者应避免被锁定在单一供应商的硬件栈中。通过使用 n1n.ai,你可以根据实时性能动态切换模型供应商,确保始终利用当前最有效的硬件和软件组合。

对 AI 初创企业的经济影响

这 10 亿美元的预订订单预示着“智能成本”即将大幅下降。如果 Sohu 能够兑现其性价比提升 20 倍的承诺,我们将看到一波此前因成本过高而无法实现的 AI 应用浪潮。例如:实时视频翻译、具有数千次迭代的复杂智能体工作流,以及超个性化的教育工具。

这些进步将通过 n1n.ai 等平台传递给用户,这些平台充当了尖端硬件与构建未来的软件开发者之间的桥梁。通过抽象化硬件层的复杂性,n1n.ai 确保了无论模型是在英伟达 GPU 还是 Etched ASIC 上运行,开发者的体验始终是无缝且高性能的。

总结

Etched 崛起至 50 亿美元估值,充分说明了行业对专用推理硬件的极度渴望。虽然英伟达将继续统治训练市场,但推理市场对像 Sohu 这样的 ASIC 来说是完全开放的。对于开发者而言,信号很明确:计算成本正在下降,AI 的速度正在提升。通过集成灵活的 API 层来适应这些硬件变革,是保持竞争力的关键。

获取免费 API 密钥,请访问 n1n.ai