系统可靠性
-
谁守护守护者?ETH Zurich新研究揭示SoC容错设计盲区,重叠保护方案实现99.9%故障覆盖率
关键词:SoC 容错、单粒子翻转、三模冗余、锁步内核、重叠保护、ECC 内存 “在太空中,一个未被纠正的比特翻转,就可能让耗资数亿美元的探测器迷失方向;在自动驾驶汽车里,一次未被检测的数据错误,就可能酿成无法挽回的安全事故。然而,当我们穷尽一切手段去加固处理器内核、纠错存储器时,是否想过一个问题:谁来检查那些负责检查的‘检查者’?” 这便是论文《Who Ch…
-
解锁Agentic AI并行化:14个核心模式提升系统可靠性与性能
构建高效的智能体(Agentic)系统,离不开扎实的软件工程实践。其核心在于设计能够协调运作、并行执行,并能与外部系统高效交互的组件。例如,推测执行(Speculative Execution) 通过预先处理可预测的请求来降低延迟;冗余执行(Redundant Execution) 则通过同时运行同一智能体的多个副本来避免单点故障,提升系统韧性。除此之外,还…