LLVM 编译快 50%、向量数据库性能高 70% 英特尔与 SambaNova 异构 AI 推理方案下半年落地

该方案将 AI 推理流程拆分为三个阶段:AI GPU 或加速器负责预填充并构建键值缓存,SambaNova SN50 可重构数据流单元(RDU)负责解码与标记生成,英特尔至强 6 处理器负责智能体工具调用、代码执行及跨硬件任务编排 … 相比 AMD EPYC,至强 6 在向量数据库工作负载中性能提升高达 70% … 相比之下,英特尔与 SambaNova 的方案依赖至强 6 处理器承担编排角色,而非英伟达产品。

原文连接