人工智能资讯|清华大学与深度求索联合推出新型AI对齐技术SPCT，大幅降低高性能模型部署门槛-数智化转型网szhzxw.cn

清华大学与深度求索（DeepSeek）合作研发出新型AI对齐技术SPCT（自我原则点评调优），突破传统依赖海量训练数据的模式，通过推理阶段动态优化输出质量。该技术采用“原则合成-响应生成-批判过滤-原则优化”的递归架构，使模型能在推理时自我修正。

测试显示，270亿参数的DeepSeek-GRM模型在每查询32次采样的推理计算下，性能媲美671B规模模型，且单次查询延迟仅1.4秒。相比340B参数的Nemotron-4（训练成本120万美元）和1.8T参数的GPT-4o（成本630万美元），DeepSeek-GRM仅需1.2万美元即可达到相近性能，成本降低99%以上。此外，SPCT减少90%人工标注需求，能耗较DPO降低73%，为实时机器人控制等场景提供新可能。

声明：本文来自网络，版权归作者所有。文章内容仅代表作者独立观点，不代表数字化转型网立场，转载目的在于传递更多信息。如有侵权，请联系我们。数字化转型网www.szhzxw.cn