第05版:金融 上一版3  4下一版
 
版面导航

第01版
头版

第02版
要闻

第03版
要闻
 
标题导航
首页 | 版面导航 | 标题导航
2023年09月18日 星期一
下一篇 4 放大 缩小 默认
数据质量和安全尤为重要
金融大模型的痛点与挑战

    作为大模型研发中必不可少的三大基础要素,算力对于大模型的训练速度有决定性影响,也是制约大模型成果水平的关键因素。                  视觉中国/图

    本报记者蒋牧云何莎莎上海北京报道

    自AI热潮掀起以来,国内互联网大厂躬身入局,各类机构奋起追赶,创业型企业纷至沓来。业内戏称,一场大模型的“百模大战”已经扩展到“千模大战”。

    根据近期中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》,中国从2020年进入大模型快速发展期,目前中国10亿参数规模以上的大模型已发布79个。从全球已发布的大模型分布来看,中国的增长态势处于领先国家之列。

    值得思考的是,一面是前期入局企业已经技术落地,另一面是新入局者仍不断增加,未来行业会形成怎样的发展格局?在各个领域内,技术落地的实际情况以及存在的挑战是什么?在全球范围内,我国与头部大模型之间的差距如何缩小? 为探寻上述问题的答案,《中国经营报》记者采访了科大讯飞研究院院长刘聪,冰鉴科技创始人兼董事长顾凌云,恒生研究院院长、恒生电子首席科学家白硕,奇富科技大模型专家甄浩。

    从加速落地到分化与竞争

    在大模型技术的落地阶段,行业的领域知识能力和工程化能力,将是重要的竞争力要素之一。

    《中国经营报》:国内从“百模大战”到“千模大战”,入局大模型的企业与机构越来越多,这对行业发展意味着什么? 在激烈竞争中,哪些是凸显竞争力的要素?

    刘聪:目前,国内大模型确实呈现“百花齐放”的态势,各家人工智能企业纷纷加大投入力度,相继发布并迭代大模型及相关产品。随着国家相关政策的不断出台与指导,大模型市场发展将进一步规范。

    竞争的优势其实取决于做什么事和做事的目标。对于基础通用大模型来说,投入非常大。基于企业能否支撑长期投入以及商业模式选择的不同,最后可能是几家基础大模型形成一个基础设施,并在此基础上衍生出一些新生态。在行业应用领域,创新创业公司也能找到应用和产品的切入点,做到很不错的成绩。

    顾凌云:“千模大战”将为行业带来颠覆性革新,极大提高目前的生产效率,特别是生成式AI,可能重新定义很多行业,很多基础性工作将由AI完成。同时,大模型也将催生诸多新模式新业态,赋能各行各业。大模型产业链可简单分为提供算力的基础层、模型层和应用层。展望未来,人工智能的应用将向纵深发展,而不仅是在宽泛的领域当中进行大规模应用。因而,丰富智能化应用场景变得非常重要。

    白硕:目前,市场上大模型研究、产品和资本的投入每周都在发生巨大变化,市场热情空前高涨,这势必加快大模型的商业化落地。随着各类大模型和创新产品的涌现,市场对于大模型的认识水平也在不断提高,优秀的大模型产品和公司将逐步脱颖而出,一批头部企业将加快显现。

    在大模型技术的落地阶段,行业的领域知识能力和工程化能力,将是重要的竞争力要素之一。以金融行业为例,因金融行业具有很强的专业性,通用大模型往往难以胜任金融业务场景,还需要为大模型注入高质量的金融数据和领域经验,让大模型更懂金融,并且根据金融领域的特定任务进行全参数的指令精调,从而获取更好的结果。

    甄浩:入局机构的增加无疑会提升整个行业的平均技术积累,要求大家在产品体验形成区隔,并在后续的商业化开发中提供更多观点与角度。将更快推动行业整体上升,也将在竞争中让行业走向成熟,应用场景与付费场景更加明确。

    需要注意的是,行业理解与行业定位、数据量、模型训练算法、算力,这些将使得各个企业更加明确自身的产品定位,深入行业变得更加重要。例如,要做全内容或全行业的大模型,需要面临成本较高、落地周期更长的问题。但如果专注某一行业赛道,对需求、行业语言和业务环节的理解,将帮助企业更高效地开发出适用于该行业的大模型。专业能力与应用构想,算力、数据、算法之间的协同,以及元素之间的平衡,将成为大模型竞争力的关键方面。

    《中国经营报》:目前,在技术落地的过程中最具挑战的是什么?

    刘聪:在技术渗透进各行各业的过程中,提升专业度是挑战之一。特别在部分领域,信息尚不完备的情况下,应用过程中需要寻找什么时候跨过人机协同的边界。什么样的问题可以由大模型自主判断,什么样的问题又需要人类专家再确认,哪些领域是基于知识,哪些又需要经验支撑,必须谨慎划分。

    白硕:对于金融领域模型而言,精调是较有挑战的一项工作。首先,需要积累更加专业的金融语料,使大模型更加专业。主要需要三种类型数据:语种强化数据可以让大模型更懂中文;领域强化数据可以让大模型更懂金融;应用强化数据可以让大模型更好地对接应用,包括金融代码工程、接口调用数据、DB/KG元数据等。三类数据的配比十分关键,只有合理的配比才能达到好的训练结果,如果配比不合理,则发挥不出数据最佳的效用。其次,需要使用更加高效稳定的大模型训练方式。恒生电子希望通过增强基座的中文特性、金融领域预训练、指令微调、强化学习等方式将大模型更加高效稳定地训练出来。

    甄浩:根据观察,金融大模型在风控场景下落地最具挑战。风控的主场景十分严谨、容错率很低,而当前的大模型擅长自圆其说,在真实性和事实验证上有不少问题,结果导致理解上或者判断上产生一定偏差,这在风控的主场景上是不能接受的。但不能否认,大模型依然能够为人力提供更多信息参照、更多风控判断的线索。因此,在风控场景下落地,奇富科技主要切入一些需要由人工进行决策或判定的场景,以辅助人效提升,从而产生规模效果,进而实现大模型赋能风控业务。

    全面提升模型效率聚焦安全可控

    对金融行业来说,如何形成“法规—模型堤坝—用户需求”之间的动态平衡十分重要。

    《中国经营报》:目前,我国的数据质量及算力基础等,较海外头部水准仍有差距。那么,我国追赶的路径有哪些?

    刘聪:在客观认识当前差距、挑战并奋力追赶的过程中,特别需要用长期主义的心态去追求更高的目标。中国认知智能大模型的发展,不仅要“弯道超车”,还需要“直道冲锋”。

    首先,在“直道冲锋”的过程中,我们会遇到各种困难与阻碍,例如芯片、高质量数据、系统迭代等。但国内在大模型各技术领域有长期的探索与积累,核心技术方面的系统性创新也“开花结果”,加上国家对这一领域的高度关注,我们在认知智能大模型的长跑中要有底气和信心。

    其次,“直道冲锋”是一场“持久战”,产业先行、科研创新与产业发展要齐头并进。产业先行,指的是创新应用后带动生态圈的整体发展。在做出阶段性成果后,科研创新与产业发展必须协同并进,彼此范式持续迭代、相互促进,持续对标并不断缩小差距。

    最后,在后续的“长跑”过程中,通过产业界和学术界的紧密协同,科研领域会诞生多方面的开源大模型,让科学家可以在这些模型平台基础上进行更加前沿的创新性工作,语音、图像、自然语言处理等领域的科研任务和目标可能也会出现新的变化。

    顾凌云:作为大模型研发中必不可少的三大基础要素,算力对于大模型的训练速度有决定性影响,也是制约大模型成果水平的关键因素。国内还有不少存量GPU(图形处理器),以支撑目前的大语言模型训练,但整体仍然还处于GPU受限的情况之中。需要指出的是,大模型不是数据规模越大越好,高质量的数据才可以使得垂直领域的大模型表现优异。在细分领域,我国很多企业本身就拥有高质量大数据。近期,国内的数据标注产业发展飞速,一些初创企业数据标注人员甚至超过千人,国内高质量数据积累将会快速发展,将为大模型提供大量高质量数据,并为垂直领域大模型“弯道超车”奠定基础。

    此外,国内互联网巨头、人工智能企业在算法方面积累丰富,而算法本身是一个渐进式的过程,需要长期迭代,需要利用算法不断优化。加之国内人才储备较多且成本更低,具有追赶潜力。

    白硕:在大模型的训练和推理过程中,高性能的计算能力至关重要。我们希望通过国产化算力支持,以确保金融大模型在本土能够高效运行。这可能涉及开发本土化的GPU、加速卡、服务器等硬件设备,以满足金融领域巨大的计算需求。同时,为了提高算力效率,还需要进行算法和硬件优化,以确保计算过程更快、更节能。

    甄浩:数据质量是国内互联网生态普遍存在的问题,相较而言,垂直于金融行业的奇富大模型,有相对明确的应用场景,而基于奇富科技多年在科技金融领域的业务积累,大量对话数据和金融场景的问题处理方案,都能形成足够的金融领域数据基座。诚然,要做成完善强悍的大模型,扩充数据来源、挖掘优质数据始终是要务之一。在这方面,我们也在寻求与更多金融同业伙伴合作,在安全的前提下提高数据的兑现潜力,帮助优化奇富大模型。

    《中国经营报》:在大模型的应用中,哪些问题还需要解决?

    刘聪:权衡安全可控与技术发展的关系是问题之一。目前已经出现一些用AI进行欺骗的案例,而拓展到多模态(图片、视频)则可能会有更多类似事件发生,所以安全可控非常必要。需要注意的是,技术发展与算法紧密相关。国内刚开始做大模型时,很多企业只做中文数据训练,甚至不敢用英文,但既然要做AGI(通用人工智能),就必须向全世界去学习知识。《生成式人工智能服务管理暂行办法》已经于8月15日正式生效,从长远来讲,针对算法的安全可控是必要的,这也是大模型配套的一环。

    顾凌云:在商业化过程中,暴露出大模型幻觉问题,以及对于大语言模型实际不了解的问题,会输出一些杜撰的结果,这在要求准确性和真实性的商业场景中很难接受。应用中需要通过一系列手段来识别和抑制大语言模型产生幻觉。此外,大模型过度依赖先验知识,不进行主动学习和探索,缺乏适应性和灵活性。

    白硕:对于金融机构来说,数据安全问题至关重要。由于大模型所收集的数据来源于公开数据,而在金融领域很多数据涉及合规、隐私,以及监管问题,很多金融机构在使用大模型时明确要求私有部署,至少在行业可信的范围内部署。这样的部署方式下,就会面临如算力挑战、参数体量等问题。如果参数体量不够大,质量可能会比较差,即使输入高质量数据,大模型也无法“涌现”。如果参数体量足够大,仅从推理来看,部署的算力成本也会比较高,金融机构是否有足够的算力将成为问题。

    甄浩:一个长久的命题是,从合规操作的角度,如何将AIGC(生成式人工智能)产品保持一个可控可用的平衡。具体来说,人类自然语言、AIGC技术的发展,以及各个行业的法条规范,三者间有一个动态的变化关系。人类自然语言变化与AIGC技术可能是正相关的,二者相互促进,而相关行业规范与法条则是必不可少的抑制力量。以我们的经验而言,法条可以被预设到大模型训练中,相当于为人脑预设类似于“道德”的堤坝。

    对金融行业来说,金融行为涉及无数的行为细节与需求、无数的业务条款,如何将法条产品化、规则化预设,形成“法规—模型堤坝—用户需求”之间的动态平衡十分重要。例如,在设计金融行业专属大模型时,预先设置信息过滤壁垒和敏感数据围栏,将用户数据或敏感数据预先封装阻隔。同时,通过产品与规则设计,将金融行业政策规范文档与条款产品化,通过预处理让大模型处于安全可控的笼子里。

下一篇 4 放大 缩小 默认
  © 版权所有 中国经营报社 合作伙伴:方正爱读爱看网
   第01版:头版
   第02版:要闻
   第03版:要闻
   第04版:特别报道
   第05版:金融
   第06版:财富
   第07版:资管
   第08版:银行
   第09版:银行
   第10版:银行
   第11版:银行·新金融
   第12版:新金融·保险
   第13版:区域·地产
   第14版:地产
   第15版:地产·家电
   第16版:地产
   第17版:快递·物业
   第18版:文旅
   第19版:能源·化工
   第20版:能源·化工
   第21版:TMT
   第22版:TMT
   第23版:TMT
   第24版:游戏
   第25版:车视界
   第26版:车视界
   第27版:车视界
   第28版:医药·健康
   第29版:快消
   第30版:快消
   第31版:快消
   第32版:与老板对话
金融大模型的痛点与挑战
国际资金遍寻避险资产 离岸人民币债券受青睐