
如果你还在用“算力决定一切”的视角看AI,那你基本已经OUT了!过去两年,行业所有的注意力都集中在GPU、HBM、算力集群上。但当大模型真正走向推理规模化、开始进入商业系统之后,一个更现实的问题浮出水面:系统开始跑不动了——不是算力不够,而是数据“流不动”。很多一线工程团队已经有一个共识——AI系统的瓶颈,正在从“算力墙”,转向“存储墙”。而这一次,闪迪在CFMS上的一系列动作,实际上就是在回答这个问题:
当AI进入推理时代,存储到底该怎么重做一遍?
先看一个被低估,但决定性的数据。在Transformer架构中,推理阶段的资源占比已经发生了根本变化:KV Cache占到了约84%,远高于模型权重本身。这意味着什么?意味着——你以为在跑模型,其实大部分资源在“存中间结果”。更麻烦的是,这些KV Cache还在疯狂膨胀。上下文长度从1K拉到128K,内存需求呈指数级增长。
再叠加多轮对话、Agent工作流、长视频理解,问题直接变成:内存装不下,成本撑不住,系统跑不稳。这才是AI推理真正的第一性问题。行业过去的解法很直接:堆内存、堆HBM。
但问题在于,这条路是不可持续的。HBM很贵,DRAM扩展也很贵,而且功耗和物理空间都在逼近极限。如果继续把所有数据都绑定在内存体系内,AI的商业化会被成本直接卡死。
于是,一个关键分水岭出现了:KV Cache,能不能离开内存?闪迪的答案是:可以,而且必须。这次最关键的一步,是把KV Cache“下放”到SSD。
闪迪公司全球产品高级副总裁Eric Spanneut在CFMS | MemoryS 2026峰会发表主题为《闪存创新赋能全域》的演讲时也有提及:“将数千个对话的KV缓存全部留存在Tier 1 存储层中是不现实的。而将KV缓存卸载至企业级SSD并实现快速检索,是更为切实可行的先进方案。”
注意,这不是优化,而是“换了一种系统运行方式”。这件事的意义在于:GPU不再被内存卡住、DRAM压力被释放、长上下文推理变得可行,推理成本出现数量级下降空间!简单说一句话:SSD开始进入“推理路径”,而不是只做冷存储。
但问题又来了——如果SSD要参与推理,它必须同时解决三个问题:容量、性能、成本。如何解决这三个问题?答案就在本次闪迪CFMS|MemoryS 2026 峰会的展台上。
这次闪迪不止带来了覆盖云、边、端全场景的闪存存储解决方案来到现场,还同时举办了媒体圆桌会议,闪迪公司副总裁兼中国区总经理蔡耀祥、闪迪公司产品市场总监张丹及闪迪公司产品市场经理耿华三位发言人共同出席,与到场媒体探讨了当今AI驱动下的闪存存储技术演进趋势,并分享了包括新品SANDISK® iNAND® MC EU721嵌入式闪存驱动器在内的全场景闪存解决方案的详细信息。
闪迪公司副总裁兼中国区总经理蔡耀祥表示:“AI应用加速普及,智能手机与智能网联汽车持续发展,数据中心基础设施不断完善。这些都带来了日益激增的数据量和更为复杂严苛的工作负载,从而对先进闪存存储技术产生了巨大需求。闪迪长期深耕中国市场,持续聚焦本土多样化需求,依托于先进的垂直整合能力、一线的NAND技术积累与产能优势,面向多元应用场景提供创新型闪存存储解决方案。在企业级、消费级、客户端、游戏、移动端及嵌入式等多个领域,闪迪通过丰富的产品组合助力客户充分释放数据价值,在AI时代擘画一条清晰的高质量发展道路。”
在此次峰会的展台上,闪迪展示了覆盖数据中心到移动终端,从智能汽车到智慧视频的丰富闪存存储解决方案,全面展现了其在AI时代全场景数据底座构建中的技术积淀与产品纵深。
移动端:首款QLC UFS 4.1新品登场,解锁终端AI新体验
在移动端,闪迪重磅推出了其首款基于QLC NAND技术的UFS 4.1嵌入式闪存解决方案——SANDISK® iNAND® MC EU721嵌入式闪存驱动器。这款新品精准瞄准了从主流到旗舰级移动智能设备对存储密度、速度与可靠性的综合需求。该产品基于先进的SANDISK® BiCS8 QLC 3D NAND技术打造,并采用UFS 4.1标准接口,兼具高性能与高兼容性。在性能表现上,其1TB容量版本的顺序读写速度分别高达4,500MB/s和4,300MB/s,并足以支持5G和Wi-Fi 7等新一代连接技术。
更值得关注的是,SANDISK® iNAND® MC EU721嵌入式闪存驱动器针对边缘AI与AR/MR/XR等创新应用进行了深度优化。它能够赋能移动设备加速实现本地化的AI数据处理,例如实时多语言翻译、智能影像语义分割和离线语音助手等,有效降低了对云端算力的依赖和延迟。此外,集成的Advanced RPMB隐私加密、设备健康异常监测及HID碎片文件管理等功能,为高性能、高安全性和长期流畅体验提供了坚实保障。据悉,该产品目前已向客户出样,提供256GB、512GB和1TB三种容量规格,并预计于2026年4月正式上市
汽车端:车规级存储助力构建新一代车载AI数据底座
随着智能网联汽车和软件定义汽车架构的加速落地,车载AI系统对存储的要求已从“能用”升级为“严苛”。智能座舱的多屏交互、自动驾驶的实时感知数据流、高精地图的动态加载,以及全车的OTA升级与日志记录,共同催生了对高带宽、大容量、高耐用度且符合功能安全要求的车规级存储的迫切需求。
针对这一趋势,闪迪在此次展会上重点展示了其车规级存储产品线的“双引擎”布局。首先是SANDISK® iNAND® AT EU752 UFS 4.1嵌入式闪存驱动器,该产品专为支持智能网联汽车和软件定义汽车等新一代车载AI系统所带来的复杂工作负载而设计。结合高速UFS 4.1接口,使得顺序读取速度高达4,300 MB/s,顺序写入速度高达4,100 MB/s(1TB容量规格),性能较前代产品提升超过两倍,能够让车载AI系统可以更快地读取数据,在系统层面提升决策响应速度。
针对新一代高性能中央计算架构,闪迪还提供了SANDISK® iNAND® AT EN610 NVMe SSD。这是一款车规级、高性能、支持宽温工作范围的存储解决方案。AT EN610采用了大容量TLC闪存,并为用户提供了将全部或部分存储空间配置为高耐久性的SLC模式的灵活选择。该产品使用M.2 1620 BGA封装,并拥有高达1TB的存储容量。
面对当下不同车载场景对存储性能的差异化需求,闪迪公司产品市场经理耿华在展会期间的圆桌会议中进一步解释道:“车载存储目前主要分为座舱和智驾两大场景。座舱应用场景对启动速度、地图加载及内容读取性能要求较高;而智驾应用场景则需同时兼顾读写性能,因为系统运行中产生的日志和视频数据需要及时存储。”
云数据中心:基于PCIe® Gen5和UltraQLC™的SSD,在计算与存储全面赋能AI
在云数据中心领域,针对AI计算密集型应用场景中的高性能存储需求,闪迪则展出了采用PCIe® Gen 5接口SANDISK® SN861 NVMe SSD,其超低的延迟和非凡的响应速度使其尤为适用于大语言模型(Large Language Model,LLM)的训练、推理和AI服务部署。针对存储密集型应用,闪迪还提供了大容量企业级UltraQLC™平台,其中SANDISK® SN670 NVMe SSD容量高达256TB,旨在为构建高速AI数据湖提供卓越的性能和容量支持,并进一步支撑AI数据准备。
智慧视频:更高耐久度支持严苛工作负载
此外,闪迪还展出了专为终端视频场景深度优化的SANDISK® Video VD QD131 microSD™高耐久视频存储卡。该存储卡支持7×24小时连续写入,适应极端工作环境,并具备智能健康监测功能,在实现大容量存储的同时兼顾高效及高可靠性,以支持智慧视频、车载等关键场景的严苛需求。
闪迪的深度布局
如果你只看到闪迪的产品层,那还不够。前不久,闪迪还通过推出开源工具SPRandom来重新定义企业级SSD测试的新范式——突破了耗时的技术壁垒,成功打造更快速、开放且具备行业影响力的真实场景性能验证标准。这款创新的开源工具SPRandom,旨在解决SSD基准测试中的重大技术瓶颈。预处理是基于实际工作负载对SSD进行测试的关键步骤,以确保性能表现准确且可重复,并真实反映客户的实际使用情况。传统上,使容量超过16TB的SSD进入稳态并进行准确测试,通常需要耗时数天甚至数周对SSD进行顺序与随机写入。而借助SPRandom工具,采用伪随机预处理方法并整合I/O基准测试工具fio(Flexible I/O Tester),可将这一过程缩短至仅仅数小时。
以创新驱动未来,助力释放AI时代数据价值
面向人工智能加速演进的新时代,数据正成为驱动产业升级与价值创造的核心生产要素,存储技术的重要性愈发凸显。作为一家具有国际竞争力的半导体公司,Sandisk闪迪专注于闪存及先进存储解决方案制造,提供覆盖数据中心、边缘计算和消费市场在内的全面的存储产品组合。
值得一提的是,闪迪之所以能够同时覆盖从云数据中心到边缘端如此广泛的产品线,背后有着清晰的逻辑。在谈到这一布局时,闪迪公司产品市场总监张丹表示:“我们现在的视角是,数据中心在赋能各个不同的场景。其实在这个发展阶段,甚至是过程之后,需要不同的边缘端像叶子一样吸收养分、采集数据,来反哺数据中心。这是一个生态的闭环,就像一棵树,我们希望它不断茁壮成长。这也是为什么我们推出了覆盖云、边、端场景的全面产品组合。”正是基于这一理念,闪迪不仅在云数据中心领域持续深耕,同时也在移动端、汽车端、智慧视频等边缘场景不断推出针对性的存储解决方案。
从口袋里的智能手机,到飞驰的智能汽车,再到驱动未来的云端AI,闪迪在CFMS 2026上展示了其深厚技术底蕴和敏锐的市场洞察力。可以看出,闪迪正以全面、精准的存储解决方案,成为AI时代不可或缺的数据基石构建者。(完)
长宏网提示:文章来自网络,不代表本站观点。