针对财报数据提取,需按目标设计五类Prompt:一、聚焦净利润与增长率,强制标准化格式;二、多指标并行提取,用分号分隔并支持计算标注;三、容错型设计,应对OCR乱码,启用模糊匹配与数值特征识别;四、动态定位,依章节权重与位置线索优先检索;五、防幻觉约束,禁推导、限术语、强溯源。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您希望借助 AI 工具快速从财报文本中提取核心财务数据,但缺乏结构化提示词设计经验,则可能因指令模糊导致输出遗漏或格式混乱。以下是针对不同财报分析目标的 Prompt 构建方法:
一、聚焦净利润与增长率的精准提取 Prompt
该 Prompt 专用于从财报原文中定位净利润绝对值及同比变动百分比,要求 AI 忽略非关键段落,仅返回数值与单位,并强制标准化输出格式。
1、在 Prompt 中明确指定目标字段:“请仅提取‘归属于母公司股东的净利润’的最新一期数值及其同比增长率”。
2、加入格式约束:“输出必须为两行:第一行为‘净利润:X.XX亿元’,第二行为‘同比增长:Y.YY%’,不得添加任何解释、括号说明或额外字符”。
3、附加上下文锚点:“若原文中出现‘本报告期’‘本期’‘2023年’等时间标识,请优先匹配紧邻其后的净利润数据;若存在多个数值,选择合并报表口径下的数值”。
二、多指标并行提取的结构化 Prompt
该 Prompt 适用于需同步获取流动性、盈利性、杠杆率三类指标的场景,通过字段分组与分隔符设计,确保 AI 输出可直接导入表格工具。
1、定义字段组:“请提取以下六项指标:流动比率、速动比率、毛利率、净利率、资产负债率、净资产收益率(ROE)”。
2、设定分隔规则:“每项指标后紧跟冒号与数值,所有指标按上述顺序排列,用英文分号‘;’分隔,末尾不加标点”。
3、嵌入校验指令:“若某指标在财报中未以标准术语出现(如用‘流动资产/流动负债’代替‘流动比率’),请基于公式自行计算并标注‘(计算得出)’”。
三、应对非标准财报文本的容错型 Prompt
该 Prompt 针对 PDF 扫描件 OCR 后产生的乱码、断行、错别字问题,通过语义泛化与数值特征识别提升提取鲁棒性。
1、启用模糊匹配:“识别含‘利 润’‘净 利’‘net profit’‘net income’等变形拼写的段落,忽略空格与换行干扰”。
2、绑定数值特征:“所有目标数值必须满足:含数字、小数点、中文单位(亿元/万元)或英文单位(billion/yuan),且前后无字母连续超过3个”。
3、设置兜底逻辑:“若未找到明确匹配项,输出‘未识别:[字段名]’,禁止虚构或插值”。
四、适配不同财报结构的动态定位 Prompt
该 Prompt 依据年报常见章节布局(管理层讨论、合并利润表、附注),引导 AI 主动跳转至高概率区域,缩短搜索路径。
1、预设章节权重:“优先扫描‘合并利润表’表格区域;若无表格,检索‘管理层讨论与分析’中‘经营成果’子章节;最后检查‘财务报表附注’第X号(收入确认)和第Y号(所得税)”。
2、注入位置线索:“在表格中,净利润通常位于最后一行或‘净利润’列与‘本年累计’行交叉单元格;在文字中,常伴随‘较上年增长’‘同比增加’等短语”。
3、限制输出范围:“仅返回首次出现的有效数值,跳过‘扣除非经常性损益后’等修饰性子项”。
五、防止幻觉的关键约束 Prompt
该 Prompt 通过双重否定与显式禁令,抑制 AI 基于训练数据生成未见于原文的推断结果,保障输出严格忠实于输入文本。
1、明令禁止推导:“不得使用财报外知识补全数据,例如不得根据‘营收增长10%’和‘毛利率持平’反推净利润”。
2、封锁替代表述:“若原文仅写‘盈利2.3亿元’,不得将其等同于‘净利润’并纳入结果;仅当出现‘净利润’‘Net Profit’‘归母净利润’等确切术语时才可提取”。
3、强制溯源标注:“每个输出数值后必须紧接括号,内填原文位置,格式为‘(来源:第Z页,第W段)’;若无法定位则输出‘(来源:未定位)’”。









