时间:2022-11-11 来源:中国证券投资基金业协会
【编者按】为深入贯彻落实党的二十大精神,引导基金行业机构践行《证券期货业科技发展“十四五”规划》,共促基金行业数字化转型,按照中国证监会总体工作部署,于2022年11月开展“证券期货业数字化转型主题宣传月”活动。通过开展“证券期货业数字化转型主题宣传月”活动,搭建交流平台,展现数字化转型成果案例,激发金融科技创新活力,营造金融科技长效发展新生态。该篇为“证券期货业数字化转型主题宣传月”系列宣传之三。
数字化转型探索与实践
——华夏基金
一、引言
当前,数据已经成为关键的生产要素,并上升为国家数字化战略的重点。中央和监管机构出台的一系列政策也为数字化转型提出了新要求,指明了发展方向。2020年4月,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》首次将“数据”纳入生产要素,明确提出“加快培育数据要素市场”;2021年3月,《中国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》中明确指出:“迎接数字时代,激活数据要素潜能”;2021年10月,证监会《证券期货业科技发展“十四五”规划》提出“数据作为要素资源发挥更大作用”。
数据的重要性早已得到行业共识,数据资产的积累是数字化转型的重要前提,补足和构建基础数据能力是重中之重。基金公司应把数据资产当作一个新的管理对象,打造覆盖全生命周期的数据资产管理体系,健全数据治理流程机制,加强统一数据平台建设,提升数据流通与共享效率。同时也要时刻思考和展望数据资产化所带来的业务模式创新,加快数据价值创造。
资本投资品种越来越多,投资环境变得越来越复杂,传统的系统化、结构化的管理模式已不能满足投研需求,各资管机构纷纷在投研一体化建设方向发力。随着市场竞争加剧,夯实主动管理能力成为资产管理机构提升核心竞争力之本。充分利用大数据、人工智能等技术挖掘海量数据蕴含的投资机会,已逐步成为各资管机构构建智能化投研体系的重要抓手。
客户群和偏好变化牵引服务创新。据BCG2020年报告,财富市场客户群体正在发生代际转化,具有“数字化基因”的千禧一代及“数字原住民”正式进入财富管理市场,并逐渐成为主力客群,这部分群体呈现高度依赖移动端、追求极致体验等特征。面对高度数字化和个性化的需求偏好,作为财富市场的重要参与者,基金公司必须借助科技力量加快加深对客户行为、心理的洞察,深刻理解客户需求,打造陪伴式服务的竞争优势。
伴随着中国资管市场蓬勃发展、客户需求的日新月异,在数字经济发展新格局下,华夏基金将“数字化”作为实现加速发展和转型升级的核心引擎。在顶层设计层面,结合公司业务战略目标,华夏基金制定了“十四五”数字化发展规划,致力于从科技赋能向科技引领升级。在应用探索层面,华夏基金在数字化战略的框架下,优先聚焦重点难点,集中力量攻坚重大项目,成立若干研究中心和特性工程团队,坚持以数据为驱动,重点在数字化营销、智能投研、运营自动化等业务领域挖掘数字化场景并深耕细作。配套基石层面,华夏基金致力于推进数据能力建设、架构管理升级、流程组织优化、金融科技生态建设等,不断提升数字化转型的基础能力。
本文将聚焦华夏基金数字化转型的某些重点方向(图1),分别从数据能力一体化建设,投研和营销两个领域的数字化实践和典型成效展开。
华夏基金数字化转型探索与实践
(一)数据能力建设探索与实践
在数字经济时代的浪潮下,用数据驱动业务创新发展已经成为企业的必然选择,证券基金行业机构也在积极地推进数字化转型,但机遇与挑战并存。数据要转化为数据要素,需要系统化、体系化的数据能力建设作为催化剂,才能释放出生产力,就如业务能力、财务能力、人力资源能力一样,数据能力已经逐渐成为企业的核心能力之一,并成为企业数字化转型必修的内功。那么如何强化数据能力建设并发挥数据价值,已成为企业数字化转型道路上必须面临的重要课题。
1、整体建设思路
在公司“十四五”数字化发展规划的指导下,华夏基金坚持统筹推进、聚焦痛点,强化数据能力建设,在完善数据治理体系、搭建大数据技术、提升数据服务能力等方面持续发力,多措并举打好“组合拳”,逐步探索形成了符合华夏基金自身特色的数据能力建设之路。
2、探索与实践
(1)制定“一体两面N中心”数据体系建设规划
整体规划上,我们提出了“一体两面N中心数据体系”建设框架,旨在通过完善一体化数据治理体系、构建“两面”大数据技术生态、打造N个数据汇聚和服务中心,逐步实现“一体牵引、两面驱动、多能力赋能”的数据体系发展愿景。进一步展开来讲,一体,即贯彻数据资产化理念,搭建和落实数据架构管理机制,持续推进数据治理各领域工作,从而为数据体系建设保驾护航;两面,不断引入各项创新技术能力,形成完善的大数据技术生态体系,“一面”满足传统结构化数据的管理诉求,“一面”支撑非结构化、大规模数据的管理趋势,以实现技术“两翼”驱动创新发展;N中心,即坚持以数据服务为落脚点的建设策略,根据业务需要和数据特点,打造投资者信息中心、产品信息中心、交易信息中心、资讯中心等多个数据整合和服务中心,全面支持数字化营销、智能投研、运营提效等应用场景,促进数据要素价值释放。
(2)完善“一体化”数据治理体系
作为支撑数据能力建设的重要基础,数据治理已经成为实现数据资产有序管理的关键手段,华夏基金在统筹规划下,以建章立制为起点,遵循分阶段、分目标、逐步成熟的原则开展具体工作,围绕数据架构、数据标准、数据质量逐渐完善数据治理体系并取得了一定的成果。
制度、流程实施层面:重点构建数据架构管控机制,全面提升数据治理水平。通过制定配套的数据架构管控办法及实施细则,并深入到系统建设流程中试点执行,在关键环节有策略地落实数据分布流转、元数据及数据资产管理、数据标准、数据模型等方面的管控,实现数据全生命周期的有效管理;推进权威数据认证,建立数据认责机制,促进“数出一口”。通过对关键业务数据进行权威数据认证,明确数据权威源头和出口、业务属主、权威属主等,此项认证举措通过数据治理工作组和金融科技委员会审批后,在公司范围内进行宣传推广,有利于减少数据重复录入和建设,促进数据一致性和共享。开展专题数据质量提升工作,保障源头数据质量。以业务数据痛点为抓手,重点解决跨系统、跨部门产生的数据一致性、准确性等问题,逐一确定数据根因和解决方案,并通过数据质量专题报告等机制对问题的解决过程进行沉淀,以形成良性循环的数据质量提升飞轮。
工具平台层面:建设企业级数据资产管理平台—达摩DM,集元数据管理、数据资产目录、数据质量监控、数据标准管理四大核心能力于一体,通过自动化进行元数据采集,建立统一的数据资产目录,支持数据标准聚合推荐及落标、数据质量闭环监控,力求通过自动化、智能化管理简化数据治理实施过程,帮助企业实现更高效的数据治理。
(3)搭建“两面”大数据技术能力
在数据能力建设过程中,大数据技术至关重要,从公司大数据技术演进的路线看,从传统数据仓库到大数据平台,从单一组件到多样化工具,这个过程中紧跟大数据时代发展,逐步提升了数据存储、计算和服务能力。
建设一体化大数据平台。通过引入大数据技术架构,构建了高性能、易扩展、高可用的一体化大数据平台,突破了传统数据库对存储容量和查询计算能力的限制,支持以横向方式无限扩展存储容量和计算额能力,增强了数据平台的水平扩展能力,提升了数据处理能力,形成企业级集中数据存储。同时提供对离线数仓应用、实时流数据应用、综合搜索引用、数据分析挖掘应用的支持,在此基础上构建销售和投研数据模型及数据集市,赋能各类业务场景。
提升实时计算能力。在金融行业数据的时效性非常重要,传统的T+1离线大数据模式有时难以覆盖复杂场景的需求,为提升实时计算能力,完成了实时计算引擎Flink的落地,支持在大数据高并发的场景中快速进行数据的处理,以往需要T+1完成的数据处理可提速到秒级。
建设非结构化数据处理平台。据IDC调查,目前企业结构化数据仅占到全部数据量的20%,其余80%都是以文件、图片等形式存在的非结构化和半结构化数据,尤其是对于基金公司营销领域、中后台运营领域来说,人工处理图片单据、文件等量比较大,有必要建设通用的非结构化数据处理能力,支撑业务部门的PDF、图片类数据解析需求,自动提取出关键信息。目前华夏基金正在运用OCR等创新技术建设非结构化数据处理平台,涵盖文本识别、图片识别、关键信息抽取等能力,未来与RPA、NLP技术结合起来,可实现跨系统、复杂流程的业务自动化,减少人工处理工作量。
(4)打造“N”个数据服务中心
为更好地推动数据赋能业务,敏捷响应用户的公共和个性化需求,基于大数据平台打造了“N”个数据服务中心,目标是通过汇聚公司数据资产,广泛整合内、外部数据,形成统一的数据底座,逐步实现数据打通共享,支持数字营销、智能投研、运营提效等应用,促进数据要素价值释放。
现已建设形成涵盖交易信息中心、资讯中心、另类数据中心、投资者信息中心等多个业务主题的服务中心,对各领域的业务开展和分析输送了源源不断地“数据”弹药。以重点中心为例,交易信息中心采集投资交易系统、估值系统、交易所的数据,加工整合并建设统一的交易数据模型,保证数据的完整性、正确性,提供统一的对外服务方式,借助大数据平台的流数据处理技术,对基金产品的各项投研指标进行实时计算,形成实时估值服务,对风控和运作等业务系统提供实时数据服务;资讯中心整合了多套资讯商数据,并进行转换、清洗、整合等工作,最终输出一套高质量、标准化的资讯主数据,解决资管机构多套资讯数据不一致的问题,全面提升金融资讯数据质量、数据时效以及数据覆盖面,为相关业务系统提供基础资讯数据支撑能力;另类数据中心基于大数据技术采集整合各类非结构化数据、外部数据,实现对投资研究的创新性赋能。
此外,在新业务和新模式快速发展的背景下,我们持续洞察新服务中心建设的必要性和可行性,以不断扩充公司数据资产,优化数据服务模式,提升数据管理能力。
二、智能化投研
在投研数字化转型方面,华夏基金组成跨部门团队实施投研一体化工程,致力于打造流程一体化、服务一体化、决策一体化的智能化平台;成立了AI Lab,统筹AI算法模型及人才资源,与投研部门密切合作开展了一系列专题研究,充分利用人工智能前沿技术助力投资决策;依托大数据、NLP等技术,构建集成的全市场数据,利用知识图谱将孤立的数据信息进行关联,增强资产价值的深度挖掘和风险监控能力,提升信息获取和决策效率。
具体来说,在智能化投研创新领域,华夏基金首先针对碎片化、多源化的投研数据进行了深度整合,面向业务端提供一站式投研数据分析平台,打通数据到业务的最后一公里服务。同时,基于整合的数据,华夏基金在知识图谱、基本面量化等投研创新应用方面也做了积极的探索和尝试。
(一) 投研数据聚合平台
投研行为高度依赖丰富的数据与信息。其中,结构化数据的比例极少,大部分以半结构化、非结构化形式杂乱分布。投研工作场景中往往存在数据碎片化、多源化、数据无法共享流动、技术能力和适配性要求高等痛点。因此,投研数据聚合平台(iData)在华夏基金应运而生。
作为华夏基金面向投资研究核心业务搭建的一站式大数据平台,iData着眼于行业数据库,力争解决行研数据的一致性、及时性、准确性、权威性等问题。联合外部科技厂商,通过自建投研数据中台,将内外部多源异构的投研数据进行统一归集、梳理、融合与输出;对外联通各券商、数据服务商,对内服务基金经理、研究员、数据分析人员等,让数据金矿触手可及。
数据上,平台深度整合了各行业数据需求,将20类多源异构数据结构化入库,沉淀为几万个常用指标,有效盘活投研数据资源,提升数据流转和共享效率;功能上,通过统一入口,提供一系列便捷高效的数据分析工具,助力数据价值的深度挖掘;技术上,依赖高性能、无代码的数据操作台,融合人工智能算子,快速实现数据处理工作。打通了多数据提供方与使用方在数据定义、数据维护、数据应用等维度的差异与壁垒,构建海量数据的闭环管理与融合体系,是兼具理念先进性与业务实用性的投研数据平台。
投研数据聚合平台解决了投研人员当下面临的数据碎片化严重、处理费时费力、缺乏规范标准等困境,打破以往IT部门与业务部门的数据藩篱,为数据资源的充分利用和管理跟踪奠定坚实基础。目前,iData已在华夏基金自建的数据中台成功部署,稳定提供数据服务,切实赋能投研业务提质增效,为行业数据生态的规范化发展提供先行探索与实践经验。
(二)知识图谱
近两年,华夏基金携手外部科技厂商打造了投研知识图谱。以提升投研信息交互和共享效率为出发点,将上下游产业链、投资逻辑通过可视化的方式表达,形成产业链、宏观、行业、个股动态跟踪框架,沉淀投资智库,助力资产价值的深度挖掘。
知识图谱是为投研业务打造的全新生产力工具,涵盖了产业链、投研逻辑、底层图谱等丰富的模块,同时配备了全量数据集和可视化交互功能。将产业链、行业、个股、实体、产品、关联方等繁杂的信息统一转换为有序的智能化关联。投研人员可以通过平台搭建可编辑、可更新、可追溯的个性化投研框架,分析模型,风险监控模板,基于个性化的投资体系实现历史回测、实时跟踪、指标预测等智能化场景,为投资决策提供有效支撑。
基于对多源异构信息的聚合和处理,知识图谱有效助力提升了投资研究效率,降低了跨行业研究的信息共享门槛,提升风险的早预见性。作为投资研究的知识中枢神经,知识图谱是智能化投研转型过程中不可或缺的一环,为AI技术在投资研究中的落地应用奠定了基础,是实现投资研究系统化、自动化、智能化的必经之路。
(三)基本面量化
在境外,机器学习等AI技术在投资研究的应用已经有了较长时间的探索。AI量化投资工具被越来越多的资产管理公司运用,不仅应用于纯量化策略的构建,还被用来辅助基本面研究,如处理海量另类数据、股票KPI预测等,进而达到辅助投资决策的目的。
华夏基金正就将可解释机器学习在基金业务领域的落地应用进行积极尝试。与境外领先的人工智能公司携手,引入基于大数据的基本面量化投资平台。将可解释AI技术作为一种辅助性的投资工具,集中应用在辅助评估海量数据集、动态股票筛选、提高投资效率等领域。
不同于以往的黑箱操作,可解释算法提供了对不同变量如何相互作用的因素,有助于解释机器学习为何会做出决策,从而让使用者对机器学习模型有更深入的了解,来辅助基本面投资策略中的因素分析、模型构建,增强投资观点生成、进行风险预警等,为基本面研究提供现代化的数据挖掘和机器学习工具。
三、数字化营销
在数字化营销方面,华夏基金正逐步推进数字化服务体系建设,利用数据技术手段,科学、细致、深入的进行投资者投前、中、后的分析挖掘,全面了解投资者在投资过程中的困惑、障碍、习惯、心理和行为。基于客户深入洞察,推动精准化、千人千面的数字化客户服务,针对广大的个人客户提供更个性化的财富配置方案、更具温度的关怀陪伴,针对机构客户提供更定制化、更专业、更高效的一体化解决方案。
其中,智能营销平台的建设是营销数字化转型中具有代表性的一环。
(一)智能营销平台
近些年,随着投资者对专业资产管理的需求日趋旺盛,资产管理行业的竞争也在加剧,这迫使基金公司着重于投资者教育和陪伴工作。基金公司的数字化营销能力也逐渐成为企业关键竞争力,但建设过程主要存在以下难点:
1、 基础弱:由于公募基金存量客户庞大,而公募基金销售长期依托代销渠道和互联网渠道,客户数据分散、多端身份不统一,导致基金公司对自身客户的理解能力比较有限,缺少对投资者需求变化和行为变化有效研究手段。
2、 难匹配:透过大量问卷和数据分析发现,不同人群、不同需求的投资者,对产品要求和收益目标等有明显的差异,操作行为也有明显的不同。这就要求基金公司具备有效客户分层识别能力,产品推荐的精细化能力,投教内容差异化能力,进而提升投资者投资体验。但由于营销系统的闭环能力较弱,很难了解基金产品是否满足了用户的需求,改善了投资体验。
3、 应用浅:在指标不科学、无体系,数据分析深度不够,缺乏业务洞察和建议等问题面前,很多企业止步在有数据和看数据阶段,并未将数据分析与营销业务结合起来,提出有意义的洞察和建议。
为帮助提升客户投资体验、充分发挥大数据资产的价值,华夏基金与多家厂商携手打造了一套全流程智能化营销解决方案。总体来说,华夏基金智能营销平台(MIPS)的建设分为六个阶段:
第一阶段:投资者数据基础建设
在投资者数据建设阶段,实现线上、线下、场外、场内投资者数据体系的集成与互通成为一个难点。建设方案为:
1.在引入大、全、细、时的线上数据埋点技术基础上,搭配ID-Mapping技术,实现线上数据与基金公司现有账号体系打通,完成投资者多端身份统一。
2. 充分将投资者基础数据模型转化为先进的用户行为模型,并利用大数据平台相关技术工具的算力、存储能力,对数据重新进行清洗、加工和模型构建等。
最终,实现了70+种投资者的线上、线下、场内等多场景的百亿数据的计算、存储和建设问题。
第二阶段:实时分析能力建设
在数据应用场景下,业务往往希望能在几秒内快速获得数据分析的结果,但实际的数据量高达上百亿。在进行分析引擎技术选型时,首先需要考虑满足亿级数据秒级查询的能力。因此,我们没有选择 Hive,而是考虑类似于MPP架构的查询引擎方案,经过全方位权衡,最终选定Impala为查询组件的解决方案。该方案引入后,配合大量的存储、计算资源,平台已经可以全面支持多渠道多场景下的百亿级数据自助式分析,解决了投资者行为分析复杂、低效、指标计算困难等问题。目前,平台可同时满足上千次分析诉求,并给出即时响应。
第三阶段:建设投资者分层能力
在人力和成本投入等受限的情况下进行“有取舍、有挑选”的客户运营,就需要提升精细化服务的能力。对比常规全量服务,精细化服务需要针对客户进行分层定义,区别不同群体投入不同成本和服务能力,从而满足不同群体客户的需求。基金客户分层的原则有两个:不同群体所呈现出不同特征,不同需求,需要分层运营;不同群体的运营目标不一样,例如低净值群体向高净值转化、非权益类持仓群体向权益类转化等目标。全客户服务场景和精细化服务场景在业务当中是同步建设的。而平台构建的分析工具,可以帮助业务实现按照生命周期、高低净值人群、投资行为、投资经验、投资偏好等不同分层来进用户运营。
第四阶段:拓展投资者挖掘能力
引入数据挖掘能力可以拓展投资者分层能力,其难点在于如何充分利用前期建设的大量数据。反复衡量多种备选组件的优劣之后,最终引入挖掘组件,并设计了基础数据的最佳同步和共享方案,保证分析组件、挖掘组件能够无障碍地使用前期建设的百亿数据底座,充分发挥分布式分析、计算、建模的优势,灵活完成投资者分层的分析。基于智能挖掘组件构建的智能挖掘平台,拥有交互式图形化人工智能开发环境,支持图拖拽操作,集丰富的预处理工具、特征工程支持、高效模型训练、模型评估能力、模型管理能力和工作流调度能力于一体,可以高效满足业务机器学习应用的开发需求,充分发挥分布式建模、预测的优势。
第五阶段:打通多触点闭环营销能力
该阶段通过引入从营销策略配置到客户触达,再到效果分析闭环式的智能运营引擎,针对投资者的投资行为进行分析、用户分层、用户分群,并搭配多种触达通道进行营销动作。之后再对行动进行效果评估和反馈,从而进行策略的快速调整,让行动越来越有效。此阶段闭环营销驱动能力的实现,依赖于前四个阶段对用户完整认知和分层能力的建立。目前已完成实验700+次。
第六阶段:深度分析专题能力
投资者分析往往围绕人、货、场三种维度展开。该阶段由专业的分析师配合业务人员,针对投资者抽样调研结果、业务提出的猜想和假设,通过构建分析专题、分析框架等方案,结合前几个阶段建设的数据和分析工具,进行大数据分析求证。
总体来说,智能营销平台MIPS为华夏基金进行投资者精细化营销和陪伴式服务打造。全面采用自助式分析工具,提供必要的数据基础和大数据分析能力,实现从营销策略配置到客户触达,再到效果分析闭环式的智能运营模式,支持多业务部门进入智能化、数字化的营销时代。
四、结语
科技创新是发展数字经济的核心源动力。基金公司等金融机构是资本市场数字化转型的主力军。
对于华夏基金来说,我们正处于数字经济持续高速发展的伟大时代里。新机遇新征程下,华夏基金将牢牢把握数字经济发展规律,致力于以数据服务为目标,以数据要素为核心,以技术创新为抓手,全面加强数据能力建设,深化技术引领业务领域创新,加速数据价值向业务价值转化,充分发挥在资本市场行业链中的“引领创新”作用,争做资本市场数字化转型先锋,助力数字经济和资本市场高质量发展。