全部带「citation-verification」标签的内容——汇聚自公众号文章、方法论、产品、模板与工具,共 1 项。
对比五个旗舰大模型写社会偏好中文文献综述的表现,核查上千条引用后发现:Claude与DeepSeek几乎零幻觉,GPT克制但篇幅不足,GLM和Kimi幻觉率高;模型差距小于工作流差距,联网核查、多智能体隔离与DOI反查是降幻觉关键。