中国经营报数字报刊平台

数据质量和安全尤为重要

金融大模型的痛点与挑战

作为大模型研发中必不可少的三大基础要素，算力对于大模型的训练速度有决定性影响，也是制约大模型成果水平的关键因素。　　　　　　　　　　　　　　　　　　视觉中国/图

本报记者蒋牧云何莎莎上海北京报道

自AI热潮掀起以来，国内互联网大厂躬身入局，各类机构奋起追赶，创业型企业纷至沓来。业内戏称，一场大模型的“百模大战”已经扩展到“千模大战”。

根据近期中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》，中国从2020年进入大模型快速发展期，目前中国10亿参数规模以上的大模型已发布79个。从全球已发布的大模型分布来看，中国的增长态势处于领先国家之列。

值得思考的是，一面是前期入局企业已经技术落地，另一面是新入局者仍不断增加，未来行业会形成怎样的发展格局？在各个领域内，技术落地的实际情况以及存在的挑战是什么？在全球范围内，我国与头部大模型之间的差距如何缩小？为探寻上述问题的答案，《中国经营报》记者采访了科大讯飞研究院院长刘聪，冰鉴科技创始人兼董事长顾凌云，恒生研究院院长、恒生电子首席科学家白硕，奇富科技大模型专家甄浩。

从加速落地到分化与竞争

在大模型技术的落地阶段，行业的领域知识能力和工程化能力，将是重要的竞争力要素之一。

《中国经营报》：国内从“百模大战”到“千模大战”，入局大模型的企业与机构越来越多，这对行业发展意味着什么？在激烈竞争中，哪些是凸显竞争力的要素？

刘聪：目前，国内大模型确实呈现“百花齐放”的态势，各家人工智能企业纷纷加大投入力度，相继发布并迭代大模型及相关产品。随着国家相关政策的不断出台与指导，大模型市场发展将进一步规范。

竞争的优势其实取决于做什么事和做事的目标。对于基础通用大模型来说，投入非常大。基于企业能否支撑长期投入以及商业模式选择的不同，最后可能是几家基础大模型形成一个基础设施，并在此基础上衍生出一些新生态。在行业应用领域，创新创业公司也能找到应用和产品的切入点，做到很不错的成绩。

顾凌云：“千模大战”将为行业带来颠覆性革新，极大提高目前的生产效率，特别是生成式AI，可能重新定义很多行业，很多基础性工作将由AI完成。同时，大模型也将催生诸多新模式新业态，赋能各行各业。大模型产业链可简单分为提供算力的基础层、模型层和应用层。展望未来，人工智能的应用将向纵深发展，而不仅是在宽泛的领域当中进行大规模应用。因而，丰富智能化应用场景变得非常重要。

白硕：目前，市场上大模型研究、产品和资本的投入每周都在发生巨大变化，市场热情空前高涨，这势必加快大模型的商业化落地。随着各类大模型和创新产品的涌现，市场对于大模型的认识水平也在不断提高，优秀的大模型产品和公司将逐步脱颖而出，一批头部企业将加快显现。

在大模型技术的落地阶段，行业的领域知识能力和工程化能力，将是重要的竞争力要素之一。以金融行业为例，因金融行业具有很强的专业性，通用大模型往往难以胜任金融业务场景，还需要为大模型注入高质量的金融数据和领域经验，让大模型更懂金融，并且根据金融领域的特定任务进行全参数的指令精调，从而获取更好的结果。

甄浩：入局机构的增加无疑会提升整个行业的平均技术积累，要求大家在产品体验形成区隔，并在后续的商业化开发中提供更多观点与角度。将更快推动行业整体上升，也将在竞争中让行业走向成熟，应用场景与付费场景更加明确。

需要注意的是，行业理解与行业定位、数据量、模型训练算法、算力，这些将使得各个企业更加明确自身的产品定位，深入行业变得更加重要。例如，要做全内容或全行业的大模型，需要面临成本较高、落地周期更长的问题。但如果专注某一行业赛道，对需求、行业语言和业务环节的理解，将帮助企业更高效地开发出适用于该行业的大模型。专业能力与应用构想，算力、数据、算法之间的协同，以及元素之间的平衡，将成为大模型竞争力的关键方面。

《中国经营报》：目前，在技术落地的过程中最具挑战的是什么？

刘聪：在技术渗透进各行各业的过程中，提升专业度是挑战之一。特别在部分领域，信息尚不完备的情况下，应用过程中需要寻找什么时候跨过人机协同的边界。什么样的问题可以由大模型自主判断，什么样的问题又需要人类专家再确认，哪些领域是基于知识，哪些又需要经验支撑，必须谨慎划分。

白硕：对于金融领域模型而言，精调是较有挑战的一项工作。首先，需要积累更加专业的金融语料，使大模型更加专业。主要需要三种类型数据：语种强化数据可以让大模型更懂中文；领域强化数据可以让大模型更懂金融；应用强化数据可以让大模型更好地对接应用，包括金融代码工程、接口调用数据、DB/KG元数据等。三类数据的配比十分关键，只有合理的配比才能达到好的训练结果，如果配比不合理，则发挥不出数据最佳的效用。其次，需要使用更加高效稳定的大模型训练方式。恒生电子希望通过增强基座的中文特性、金融领域预训练、指令微调、强化学习等方式将大模型更加高效稳定地训练出来。

甄浩：根据观察，金融大模型在风控场景下落地最具挑战。风控的主场景十分严谨、容错率很低，而当前的大模型擅长自圆其说，在真实性和事实验证上有不少问题，结果导致理解上或者判断上产生一定偏差，这在风控的主场景上是不能接受的。但不能否认，大模型依然能够为人力提供更多信息参照、更多风控判断的线索。因此，在风控场景下落地，奇富科技主要切入一些需要由人工进行决策或判定的场景，以辅助人效提升，从而产生规模效果，进而实现大模型赋能风控业务。

全面提升模型效率聚焦安全可控

对金融行业来说，如何形成“法规—模型堤坝—用户需求”之间的动态平衡十分重要。

《中国经营报》：目前，我国的数据质量及算力基础等，较海外头部水准仍有差距。那么，我国追赶的路径有哪些？

刘聪：在客观认识当前差距、挑战并奋力追赶的过程中，特别需要用长期主义的心态去追求更高的目标。中国认知智能大模型的发展，不仅要“弯道超车”，还需要“直道冲锋”。

首先，在“直道冲锋”的过程中，我们会遇到各种困难与阻碍，例如芯片、高质量数据、系统迭代等。但国内在大模型各技术领域有长期的探索与积累，核心技术方面的系统性创新也“开花结果”，加上国家对这一领域的高度关注，我们在认知智能大模型的长跑中要有底气和信心。

其次，“直道冲锋”是一场“持久战”，产业先行、科研创新与产业发展要齐头并进。产业先行，指的是创新应用后带动生态圈的整体发展。在做出阶段性成果后，科研创新与产业发展必须协同并进，彼此范式持续迭代、相互促进，持续对标并不断缩小差距。

最后，在后续的“长跑”过程中，通过产业界和学术界的紧密协同，科研领域会诞生多方面的开源大模型，让科学家可以在这些模型平台基础上进行更加前沿的创新性工作，语音、图像、自然语言处理等领域的科研任务和目标可能也会出现新的变化。

顾凌云：作为大模型研发中必不可少的三大基础要素，算力对于大模型的训练速度有决定性影响，也是制约大模型成果水平的关键因素。国内还有不少存量GPU（图形处理器），以支撑目前的大语言模型训练，但整体仍然还处于GPU受限的情况之中。需要指出的是，大模型不是数据规模越大越好，高质量的数据才可以使得垂直领域的大模型表现优异。在细分领域，我国很多企业本身就拥有高质量大数据。近期，国内的数据标注产业发展飞速，一些初创企业数据标注人员甚至超过千人，国内高质量数据积累将会快速发展，将为大模型提供大量高质量数据，并为垂直领域大模型“弯道超车”奠定基础。

此外，国内互联网巨头、人工智能企业在算法方面积累丰富，而算法本身是一个渐进式的过程，需要长期迭代，需要利用算法不断优化。加之国内人才储备较多且成本更低，具有追赶潜力。

白硕：在大模型的训练和推理过程中，高性能的计算能力至关重要。我们希望通过国产化算力支持，以确保金融大模型在本土能够高效运行。这可能涉及开发本土化的GPU、加速卡、服务器等硬件设备，以满足金融领域巨大的计算需求。同时，为了提高算力效率，还需要进行算法和硬件优化，以确保计算过程更快、更节能。

甄浩：数据质量是国内互联网生态普遍存在的问题，相较而言，垂直于金融行业的奇富大模型，有相对明确的应用场景，而基于奇富科技多年在科技金融领域的业务积累，大量对话数据和金融场景的问题处理方案，都能形成足够的金融领域数据基座。诚然，要做成完善强悍的大模型，扩充数据来源、挖掘优质数据始终是要务之一。在这方面，我们也在寻求与更多金融同业伙伴合作，在安全的前提下提高数据的兑现潜力，帮助优化奇富大模型。

《中国经营报》：在大模型的应用中，哪些问题还需要解决？

刘聪：权衡安全可控与技术发展的关系是问题之一。目前已经出现一些用AI进行欺骗的案例，而拓展到多模态（图片、视频）则可能会有更多类似事件发生，所以安全可控非常必要。需要注意的是，技术发展与算法紧密相关。国内刚开始做大模型时，很多企业只做中文数据训练，甚至不敢用英文，但既然要做AGI（通用人工智能），就必须向全世界去学习知识。《生成式人工智能服务管理暂行办法》已经于8月15日正式生效，从长远来讲，针对算法的安全可控是必要的，这也是大模型配套的一环。

顾凌云：在商业化过程中，暴露出大模型幻觉问题，以及对于大语言模型实际不了解的问题，会输出一些杜撰的结果，这在要求准确性和真实性的商业场景中很难接受。应用中需要通过一系列手段来识别和抑制大语言模型产生幻觉。此外，大模型过度依赖先验知识，不进行主动学习和探索，缺乏适应性和灵活性。

白硕：对于金融机构来说，数据安全问题至关重要。由于大模型所收集的数据来源于公开数据，而在金融领域很多数据涉及合规、隐私，以及监管问题，很多金融机构在使用大模型时明确要求私有部署，至少在行业可信的范围内部署。这样的部署方式下，就会面临如算力挑战、参数体量等问题。如果参数体量不够大，质量可能会比较差，即使输入高质量数据，大模型也无法“涌现”。如果参数体量足够大，仅从推理来看，部署的算力成本也会比较高，金融机构是否有足够的算力将成为问题。

甄浩：一个长久的命题是，从合规操作的角度，如何将AIGC（生成式人工智能）产品保持一个可控可用的平衡。具体来说，人类自然语言、AIGC技术的发展，以及各个行业的法条规范，三者间有一个动态的变化关系。人类自然语言变化与AIGC技术可能是正相关的，二者相互促进，而相关行业规范与法条则是必不可少的抑制力量。以我们的经验而言，法条可以被预设到大模型训练中，相当于为人脑预设类似于“道德”的堤坝。

对金融行业来说，金融行为涉及无数的行为细节与需求、无数的业务条款，如何将法条产品化、规则化预设，形成“法规—模型堤坝—用户需求”之间的动态平衡十分重要。例如，在设计金融行业专属大模型时，预先设置信息过滤壁垒和敏感数据围栏，将用户数据或敏感数据预先封装阻隔。同时，通过产品与规则设计，将金融行业政策规范文档与条款产品化，通过预处理让大模型处于安全可控的笼子里。

	第01版：头版
	第02版：要闻
	第03版：要闻
	第04版：特别报道
	第05版：金融
	第06版：财富
	第07版：资管
	第08版：银行
	第09版：银行
	第10版：银行
	第11版：银行·新金融
	第12版：新金融·保险
	第13版：区域·地产
	第14版：地产
	第15版：地产·家电
	第16版：地产
	第17版：快递·物业
	第18版：文旅
	第19版：能源·化工
	第20版：能源·化工
	第21版：TMT
	第22版：TMT
	第23版：TMT
	第24版：游戏
	第25版：车视界
	第26版：车视界
	第27版：车视界
	第28版：医药·健康
	第29版：快消
	第30版：快消
	第31版：快消
	第32版：与老板对话

	金融大模型的痛点与挑战
	国际资金遍寻避险资产离岸人民币债券受青睐