中国邮政储蓄银行
时间:2026-05-25 09:00:00 ~ 2026-05-26 12:00:00 作者:中国邮政储蓄银行:智驭未来,邮储银行大模型金融应用测试技术研究与实践 投票数:0
针对大模型技术融入金融业务所带来的测试范式挑战——包括输出非确定性、输入无限多样性、行为不稳定性及用例数量爆炸式增长等问题,邮储银行立足行业实际,构建了一套体系化、规范化的大模型交互能力评测标准。该标准以“能力-维度-场景”三层架构为核心,将大模型的智能化交互能力分解为基础对话、信息提取、意图识别与流程决策四项逐层递进的能力,并细化为可量化的测试维度,同时锚定典型金融业务场景,形成《大模型金融应用测试设计参考表》。在此基础上,邮储银行创新性地采用正交测试设计思想构建测试用例库,并推行人机协同的评测流程,结合基于余弦向量法的自动化语义验证方法,有效提升了测试效率与覆盖度,为“人工智能+”在金融领域的安全、高效落地提供了关键技术保障