全部带「rlhf」标签的内容——汇聚自公众号文章、方法论、产品、模板与工具,共 1 项。
IJCAI 2025综述梳理博弈论与大模型交叉的四大前沿:LLM在博弈中的行为评估、Shapley值可解释性、Nash均衡改进RLHF对齐、社会选择理论处理偏好异质,并展望LLM拓展博弈论研究边界。