36氪首发 “华为天才少年”创业连融超4亿元做新雨燕直播- NBA直播- 足球世界杯 LIVE一代推理芯片重构显存成本
2026-04-20雨燕直播,NBA直播,世界杯直播,足球直播,台球直播,体育直播,世界杯,欧洲杯,苏超直播,村BA直播,苏超联赛,村超,村超直播
行云是AI芯片领域少有的‘第一性原理’思考者,季宇博士24年就前瞻性地洞察到MoE稀疏架构下硬件瓶颈从算力向显存迁移的结构性转变——放弃HBM、以LPDDR乃至NAND重构显存成本,不是渐进优化,而是通过系统级的软硬件协同设计能力推动行业范式创新。2026年以来随着AI模型coding和agent能力持续增强,AI推理需求爆发,OpenClaw等Agent的现象级破圈,正在将推理算力需求从云端拉向多端,从程序员推向大众,高效低成本的推理能力成为行业刚需。伴随未来推理需求的指数级增长,行云的技术路径将成为推动算力普惠的重要基础设施。
赛富投资基金负责科技赛道的管理合伙人蒋驰华表示:在AI大模型向万亿参数演进的过程中,降本的关键已经不在算力,而在显存和系统的架构,特别是在国产算力受限的前提下。季宇和行云团队展现出了罕见的系统级工程视野,他们跳出了盲目堆砌HBM的行业定式,通过LPDDR/NAND等介质替换与并行架构设计,将显存和系统成本打下来一到两个数量级,进而实现单Token成本极值,符合行业演进的方向。我们始终聚焦AI与具身智能领域的底层颠覆者。行云兼具前瞻的架构创新与扎实的落地能力,赛富很荣幸能在这一轮重仓支持。我们期待行云的新一代推理芯片彻底重构算力成本模型,真正实现大模型推理在云端与端侧的全面普惠。
春华资本表示:在国产算力生态加速构建的大背景下。行云敏锐地将设计重心锚定在显存成本重构上,以LPDDR与NAND替代HBM、通过多通道并行架构弥补单颗粒带宽不足,本质上是在重新定义推理芯片的成本架构。季宇博士对AI芯片架构的演进方向有着超越行业惯性的深度思考,他对‘降本关键在显存而非算力’的判断,始终领先行业共识半步,且每一步都在被市场持续验证;余洪敏博士作为从海思昇腾到百度昆仑芯一路走来的芯片老兵,对芯片从设计到量产的每一个环节都有实战积累。这种‘敢想’与‘能做’的结合,让行云具备了从架构创新到产品交付的完整闭环能力。我们期待行云的首颗自研芯片顺利流片,开启AI推理算力的新一轮成本革命。
佰维存储科技股份有限公司副总经理王灿:在大模型从通用AI向Agent形态演进的发展阶段,季宇博士展现了极具前瞻性的系统级洞察。他精准地识别出:大模型推理的结构性瓶颈已不再仅仅是算力本身,而是制约规模化落地的更低成本的存储。行云的核心逻辑非常清晰——通过介质替换与架构创新,以低成本的LPDDR乃至NAND介质挑战昂贵的HBM霸权,这不仅是物理介质的更迭,更是对大模型推理成本结构的底层重构。围绕这一核心路径,行云构建了极致的软硬件协同设计,通过PD分离、分布式扩展等手段,在系统层面实现了性能与成本的平衡。芯片行业,工程经验决定了从‘实验室架构’到‘商业化量产’的跨度。行云团队在昇腾、昆仑芯等顶尖项目上积淀的深厚流片与量产经验,是其确定性的来源。在AI Agent爆发的当下,我坚信行云能够真正击穿算力成本,让高质量的万亿级模型实现真正的算力普惠。返回搜狐,查看更多


