CPU并行
-
PoCL如何用LLVM Pass把GPU思维“编译”成CPU代码:OpenCL 3.0在CPU上的SPMD魔法
SPMD 是 OpenCL 的核心灵魂:成千上万的工作项(work-item)在同一段内核代码中并行推进,遇到 barrier() 时整齐划一地同步对齐。 这套执行模型在 GPU 上由硬件原生支撑,然而一旦目标平台变为 x86_64、ARM64 或 RISC-V 这类只能单线程串行执行的 CPU,难题便浮出水面——如何让一个 CPU 核心同时模拟 256 个…