年度归档: 2026 年

1 篇文章

提示词工程:质量如何影响LLM的答案准确性
本研究通过对照实验,系统考察提示词质量对LLM答案准确性的影响。实验设置低、中、高三类提示词质量,以DeepSeek和豆包为测试模型,覆盖解题、资料查找、复杂实践三类任务,共收集162条输出样本。结果表明:第一,提示词质量显著正向影响答案准确性,从低质量提升至中质量时准确度提升30%-50%,但继续提升至高质量时边际收益递减至10%-20%;第二,任务类型对提示词质量的敏感度存在显著差异,资料查找任务最为敏感(准确度提升率最高达139%),解题任务次之,复杂实践任务最弱;第三,高质量提示词的特征贡献排序为:步骤拆解>角色设定>格式约束>示例引导。此外,研究发现豆包模型在高质量提示词条件下因“指令过载”出现异常低分,提示提示词复杂度存在最优区间。基于上述发现,本文提出了面向高校学生的提示词优化策略。