微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复

微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复

《三体》中,人类为文明选择的“亿年级”存档方案,是最原始的“把字刻在石头上”。如今,微软的研究团队真正将数据刻在了玻璃里

《自然》杂志最新发表的研究,展示了一种名为Silica的三维光学玻璃存储技术。在一块巴掌大小(120mm×120mm)、仅2mm厚的玻璃片中,研究团队实现了301层数据的三维写入。其数据密度达到1.59 Gbit·mm⁻³,总容量4.84TB,单光束写入通量为25.6 Mbit·s⁻¹,每比特能耗仅10.1nJ。

微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复

这相当于能存储近500万本1MB大小的电子书,或约100万张5MB大小的照片。

更惊人的是其耐久性。针对相位体素编码方案(对应2.02TB可用容量),加速老化实验外推结果显示,在290℃高温下,其特征寿命可达10000年。

为何需要“玻璃硬盘”?人类产生的数据正以指数级速度增长,总量大约每三年翻一番,其中大量数据需要保存数十年甚至数百年。然而,现有的磁带和硬盘通常几年就开始退化,数据不得不定期“迁移”到新介质上,耗费巨大的时间、设备和能源成本。

玻璃是一种天然适合长期存储的材料——热稳定、化学稳定、不怕潮湿、不受电磁干扰。利用飞秒激光在玻璃内部写入数据的思路此前已有研究,但大多只优化了单一环节,未能完整实现从写入、存储到读取、解码的全链路闭环。Silica技术则在所有关键存储指标上均表现达标,并展示了全流程可靠运行的完整方案。

微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复

数据如何被写入玻璃?

Silica系统的整体架构如下图所示。

微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复

将数据写入玻璃,其核心技术是飞秒激光。飞秒是时间单位,1飞秒等于一千万亿分之一秒。这种激光脉冲极短、能量高度集中,作用于玻璃内部时,能在微观层面改变玻璃的光学性质,形成一个个极其微小的光学“标记点”,称为体素(voxel),可理解为三维空间中的像素。每个体素可表示多级符号,而非单一的二进制位。

具体编码方式上,微软团队开发了两种方案。

微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复

第一种是双折射体素,写入介质为高纯度石英玻璃。激光在玻璃内部制造出极小的拉长形纳米空洞,空洞的朝向由激光的偏振方向决定。改变偏振方向,就改变了空洞的朝向,相当于写入了不同的符号。论文中使用了8个不同的方位角等级,即一个体素可实现8种状态编码,对应3比特。

这种方式有一个巧妙的写入技巧:每个激光脉冲被分成两部分,一部分负责“打地基”(形成初始的空洞种子),另一部分负责将上一个脉冲留下的种子“拉长定型”成数据体素。这样,每个脉冲到来时,就有一个体素被“定型完成”,体素的生成速率接近激光的重复频率(论文中使用的飞秒激光重复频率为10 MHz)。

注:由于每个体素存储的用户比特数还需扣除纠错冗余,因此论文最终报告的用户数据写入吞吐量低于理论峰值。

微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复

第二种是相位体素,写入介质为成本更低的硼硅酸盐玻璃(实验室常见的耐热玻璃)。

微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复

这种方式更为直接:通过调节激光脉冲的能量强弱来改变玻璃局部的折射率,能量不同,折射率变化不同,对应不同的数据符号。团队利用声光调制器(AOM)对光束能量进行调制。每个体素仅需一个脉冲即可完成写入,因此体素可在10 MHz的激光重复频率下高速生成。

微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复

两种方式产生的光学变化都非常微弱,其优点是散射和串扰很低,因此可以在玻璃内部堆叠多层。

写入质量如何保证?激光系统中的任何光学元件的微小波动都可能影响写入质量。为此,团队设计了一套双重质量控制系统。

第一层是离线标定。在写入数据前,先测量整个光路中的各种不均匀性(如扫描器不同面的反射率差异、物镜在不同深度的表现差异),计算出补偿参数并存储。在写入数据时,系统自动叠加这些补偿。

第二层是闭环控制。激光在玻璃上形成体素的瞬间,会产生等离子体发光。系统通过摄像头实时捕捉此发光信号,如果发光强度偏离目标值,便立即通过调制器调整激光功率,将能量拉回正轨。这就像一个持续运转的“自动纠偏器”,确保每个体素的写入质量稳定。

微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复

数据如何被读取?

将数据写入玻璃后,如何精准、完整地读取出来同样是关键挑战。Silica系统的读取环节,结合了定制化光学显微镜与机器学习解码,在经过纠错码校正后,最终实现了所有写入数据的完美还原。

读取的核心设备是宽场光学显微镜。研究人员将写好数据的玻璃片置于显微镜下,系统通过高精度位移台控制玻璃片移动,对玻璃内部的体素层进行逐层拍照。

微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复

写入(左)与读取(右)设备

针对两种不同的体素,团队采用了不同的成像方式。

对于双折射体素,使用偏振分辨显微镜,在3个不同的偏振状态下拍摄同层体素的多张照片。通过对比不同偏振态下的图像差异,精准判断每个体素的朝向。

微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复

对于相位体素,使用Zernike相衬显微镜,利用相衬技术将折射率的微小变化转化为肉眼可辨的明暗对比,从而区分不同的折射率等级,还原数据符号。

微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复

拍摄到的显微图像并非直接可用,还会受到噪声、光学散射和体素间串扰的影响。卷积神经网络(CNN) 成为了解码的核心。团队使用大量带有已知数据的体素显微图像训练AI模型,让模型学会从模糊、有干扰的图像中,准确推断出每个体素对应的真实数据符号。

这个AI模型的“视野”广阔,它不仅关注单个体素对应的几个像素,还会参考周围体素的上下文信息,甚至结合玻璃不同深度的多帧图像,以应对光学散射和层间干扰,大幅提升解码精度。

微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复

符号推断完成后,系统先将符号转化为比特概率,再通过LDPC纠错码进行错误校正。这是一种广泛应用于5G通信标准的高效纠错算法,能够修正读取和解码过程中产生的微小错误。最终实验验证,所有写入玻璃的数据均被完整、无误地读取,实现了真正的零错误数据恢复。

Silica的两种体素写入方案在性能上各有侧重:
* 双折射体素(石英玻璃):在120mm×120mm×2mm的玻璃片中可写入301层,数据密度1.59 Gbit/mm³,可用存储容量4.84TB;单光束写入通量25.6 Mbit/s,写入能效10.1 nJ/bit。
* 相位体素(硼硅酸盐玻璃):在同尺寸玻璃片中可写入258层,数据密度0.678 Gbit/mm³,可用存储容量2.02 TB;单光束写入通量18.4 Mbit/s,写入能效8.85 nJ/bit。

相位体素方案虽然在密度和容量上稍逊,但优势明显:玻璃介质成本更低、写入和读取的硬件结构更简单,且支持多光束并行写入。论文中演示了4光束并行写入,通量直接提升至65.9 Mbit/s,且未观察到明显热损伤。团队的热模拟表明,未来扩展至16束及以上光束并行写入同样具备可行性,为规模化高速写入奠定了基础。

而双折射体素方案虽性能更优,但受限于介质特性,只能在高纯度石英玻璃上工作,且写入需要偏振调制器、读取需要多状态偏振成像,硬件复杂度和成本更高。

团队并未做出二选一的结论,而是认为两种方案各有应用场景,未来可根据具体的成本预算、性能需求和应用规模灵活选择。

万年存储与系统稳定性

此外,团队对写入了相位体素的玻璃进行了加速老化实验。研究人员将样品置于440℃至500℃的高温炉中进行退火处理,通过监测体素的衍射效率变化,追踪其光学结构的衰减过程。

随后,利用物理学中的阿伦尼乌斯公式(温度越高,化学反应速率越快)从高温实验数据向低温方向外推,测算常温下的衰减速率。实验结果显示,这些写入玻璃的体素,在290℃的高温环境下,特征寿命就已超过10000年。日常存储的室温远低于290℃,体素的光学结构将更加稳定,数据的实际保存时间只会更为漫长。

微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复

不过,论文中也指出,这一寿命仅反映了玻璃内部光学结构的热稳定性,并未考虑极端的机械冲击、化学腐蚀等外部因素。但对于常规的档案存储环境而言,这一数值已远超磁带、硬盘等现有存储介质。

除了超长寿命,Silica技术还展现出极高的可重复性与稳定性。为验证这一点,研究团队将同一组数据分别写入3片玻璃,并对每片玻璃进行了至少11次读取,总计完成37次读取实验,实验时间跨度长达数月。

结果显示,不同读取实验之间,数据密度的波动中位数仅为0.25%。这表明Silica技术能在长时间、多设备的条件下,稳定且可重复地实现接近最佳水平的存储与读取效果。

最后,团队指出该技术仍有巨大的升级与扩展空间:
– 未来可通过提升激光物镜的数值孔径,将写入能量减半、体素体积缩小,从而进一步提升存储密度。
– 采用更高重复频率的商用飞秒激光,结合数百束光束的空间多路复用,可实现写入通量的飞跃。
– 新型玻璃成分的研发,有望进一步降低体素改性的能量阈值,提升体素质量与写入能效。

论文链接:https://www.nature.com/articles/s41586-025-10042-w
参考链接:https://www.scientificamerican.com/article/microsoft-scientists-invent-tiny-glass-books-that-could-store-data-for/

微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/22023

(0)
上一篇 1天前
下一篇 1天前

相关推荐