
梦晨 发自 凹非寺量子位 | 公众号 QbitAIkaiyun体育登录网页入口
英伟达眼睁睁地看着,大客户们一个接一个的自研芯片。
谷歌、微软、亚马逊……OpenAI是最新一个。
OpenAI发布首款自研推理加快芯片Jalapeño,皆集博通和Celestica互助打造。
与GPU四肢通用加快器不同,Jalapeño专为ChatGPT、Codex以及将来智能体居品量身定制,从芯片到通盘配套的基础身手,弥漫针对大模子责任负载优化。
只用9个月,从0开动想象到到流片,是迄今限度高性能先进半导体ASIC范围最快的开垦周期。
到2026年底,就能初步部署。
OpenAI公告中霸气界说:这,即是全栈上风。
在OpenAI之前,谷歌、亚马逊、微软、Meta仍是先后走上了自研芯片这条路。在OpenAI之后,Anthropic也在研讨自研芯片。
英伟达的超等客户清单,正在酿成一份竞争敌手名单。
OpenAI首款AI芯片
为OpenAI操刀Jalapeño的是Richard Ho,前谷歌TPU团队的中枢成员。
他还担任过光估计芯片公司Lightmatter的高档副总裁,更早期皆集创办过EDA公司0-In Design Automation。
他的资历横跨芯片想象、AI加快和光互联三个范围,确实是为”想象下一代AI推理芯片”量身定作念的布景。
Richard Ho深化:“咱们围绕对前沿AI模子最热切的内核、内存出动、网罗和处事样式优化了通盘架构。”
关于这类系统而言,峰值性能仅仅问题的一部分。更难也更热切的问题是,在坐褥环境中硬件究竟能推崇多大的作用。
在架构层面,Jalapeño通过减少数据搬运、均衡估计、内存和网罗资源来完了更接近表面峰值的本色期骗率。
博通提供了硅片完了和网罗互联期间,包括其Tomahawk网罗芯片,匡助将通盘平台推向大范围量产。
Jalapeño谋略在2026年底部署到微软过甚他互助伙伴的数据中心,博通CEO陈福阳暗意这是“吉瓦级数据中心”部署的开动。
现在OpenAI尚未公布任何性能基准数据,仅深化早期测试娇傲”每瓦性能大幅优于刻下最先进水平”,工程样片已在履行室中运行GPT-5.3-Codex-Spark。
详备期间论说预测将来几个月内发布。
英伟达大客户接踵“敬佩”
2016年,谷歌发布了为TensorFlow定制的TPU。这是科技巨头中第一个公通畅告自研AI芯片的,其时英伟达GPU在AI历练范围确实莫得敌手。
2018年,亚马逊发布了推理芯片Inferentia。2022年又推出历练芯片Trainium,开动遮掩AI估计的无缺链路。
2023年,微软亮相Azure Maia加快器,这家同期亦然OpenAI最大投资方和算力供应商的公司,礼聘了我方下场。
2026年6月,OpenAI发布Jalapeño。同庚4月,路透社报说念Anthropic正在研讨想象我方的芯片,尽管该公司尚未公开证据。
OpenAI总裁Brockman在Jalapeño发布声明中说:“寰宇正在迈向算力驱动的经济。”
这句话说明了通盘东说念主的动机,当算力成为中枢坐褥而已,莫得东说念主舒心把命根子完全交给英伟达。
参考贯穿:[1]https://openai.com/index/openai-broadcom-jalapeno-inference-chip/[2]https://www.linkedin.com/feed/update/urn:li:activity:7475540055822901248/
一键三连「点赞」「转发」「防卫心」kaiyun体育登录网页入口
