likes
comments
collection
share

全场景式全流程监控,博睿数据为券商IT运维难题提供了范例

作者站长头像
站长
· 阅读数 23

在金融科技浪潮以及证券行业生态竞争加剧的多重因素下,数字化转型已成为券商未来发展的全新战略高地。

2020年8月,中国证券业协会发布了《关于推进证券行业数字化转型发展的研究报告》,其中提到,我国证券行业在信息技术投入方面经历了以交易无纸化为重点的电子化阶段、以业务线上化为重点的互联网证券阶段,目前正处于向数字化转型阶段。

此外,随着数字技术渐趋成熟,为证券行业探索“新业态、新模式”创造了条件,尤其是疫情防控催生金融服务线上化需求,为证券行业数字化转型发展提供了契机。如何推进证券行业数字化转型,以科技赋能业务发展,从而实现证券公司高质量发展,成为摆在资本市场重要参与主体面前的重大课题。

证券行业属于高度信息化行业,早已“赢在起跑线上”。但即便如此,数字化技术的应用还是在一定程度上改变了证券行业的传统商业模式,以及运维、运营、风控等传统工作方式,给证券行业带来了前所未有的机遇与挑战。

同时,券商队伍日益健壮,金融业务不断延长,摩根大通等外资券商的入局也对行业带来“鲶鱼效应”,市场对券商的服务质量与服务效率提出了更高的要求。

这倒逼券商纷纷开展以IT技术为核心的数字化转型,提升市场竞争力,越来越多的科技型券商纷纷出圈,引领数字化转型潮流。

监控被动成券商用户体验“硬伤”

伴随近些年人工智能技术的蓬勃发展与推广使用,IT运维领域也逐渐展现新的演进趋势,智能运维逐渐成为各金融企业应对新业态、发展金融科技的强有力抓手之一。随着证券业务的迅速发展,IT的规模也越来越大;原来竖井式的IT系统管理和运维平台工具建设的模式越来越不适应实际需求规模的扩大同样带来资源无法有效利用,原有工具分散建设未能统一规划数据共享,给成本核算带来影响;资源精细管理缺乏数据支持,存在一定程度地浪费,不利于资源的有效利用。支持业务创新能力不足,应用越来越复杂,需要记录系统逻辑架构、评审记录、应用相关配置;应用规模越来越大,更新速度加快,要求自动化、弹性交付等都无法满足。

对于运维内部来讲,人员精力陷于人工沟通、手工数据搜集等工作 ,技能提升慢成就感低,单一资源请求需要反复提交多个申请单才能完成,紧急需求无法满足,缺乏流程进度跟进,用户无法获知请求处理情况,用户体验较差。

为了应对战略转型下的IT系统运维管理难题,需要构建统一运维管理平台,统一纳管资源,IT基础资源的分配、回收、日常操作和监控通过平台自动化完成;IT系统监控指标自动采集,根据预先设定的规则处理性能状态数据,实时告警;运维流程纳入线上管理,结合监控和自动化工具,严格控制变更和操作风险;同时就IT整体运行情况定期出具运营报告,根据容量管理指引对容量趋势做分析,为运营管理提供数据支撑。

需要注意的是,证券系统关系到用户的资产信息,天然敏感度极高。交易系统的响应时延和稳定性直接影响用户的利益。

监管机构对开市期间的核心交易系统的故障有一个5分钟的红线。系统不可用超过5分钟可能面临严重的处罚。

其次,随机波动的行情给业务系统的稳定运行带来了极大挑战。毫不夸张的说,当行情来临时,天天都是双十一。但是,就跟拆盲盒一样,你永远也不知道双十一会在哪天到来。

第三,由于缺乏有效的性能测试结果作为参考基准,应用系统的部署主要依靠人工经验来推算。当故障来临时,只能被动应对。

第四,复杂的架构导致线上故障定位困难。证券行业核心交易系统长期依赖外购,但是近些年业务创新对我们的软件交付速度提出了更高的要求。

因此,对于证券行业而言只有深入运维一线,才能获得最真实的数据,只有摸清客户最基本的需求,才能拿出有针对性的解决方案,才能兼顾‘用得容易’和‘解决问题’两个方面的问题。

此外,艾媒咨询发布《2020年中国互联网证券行业发展状况研究报告》显示,中国证券类APP用户规模稳定增长,2019年达到1.11亿人,2020年预计增至1.29亿人。券商App用户在迅速增长。这促使用户对于券商移动端应用的兼容性、功能性、性能效率等众多维度产生更高要求。

全景式监控全流程,化被动为主动

基于此,博睿数据的睿视数据可视化分析平台帮助客户实现运维从工具化向自动化、智能化方向的演进。从用户的实际情况出发,以数据作为切入点进行面向业务的数据可视化分析,解决目前运维管理中面临的一些实际问题。达到提升业务连续性管理水平,提升运维管理水平,从而最终提升IT服务质量及用户满意度。

通过网络旁路镜像的方式,7*24 小时实时采集数据中心关键 网络节点的网络流量。对现有网络、应用不产生任何影响; 并且采用集中管理的方式,管控分离的方式进行稳定多级的 管理,并且可以针对不同的角色进行权限控制。

在网络性能监控层面,通过Reesii提供的数据进行优化,经过优化后明显提升数据中心内部的网络质量,目前各网络区域的网络评分大部分接近满分,个别区域未优化完的也保持在95分以上。

在端到端场景监控层面实现了从客户端到交易主机各个应用节点的访问关系路径和详细网络指标端到端的可视化。并且可针对各访问节点网络参数的整体时间趋势的可视化,能够分钟级快速定位故障到某一单一节点并且提供对该节点故障的下钻智能分析,快速解决应用端到端故障。

在专线链路场景监控层面,突破传统运维只能通过单 一维度关注线路的情况以及排障盲点。以地图的形式更生动直观的对所有专 线实现可视化。结合智能告警和多维度指标多视角对线路当前情况有更全面的了解。

在根因分析及告警方面,突破传统运维告警通过一刀切的阈值设置方式,增加更加灵活的告警设置策略,降低运维人员对业务告警策略的设置难度,也减少了对变化莫测的数据业务量配置的工作量;提供更加准确的有效告警信息,从而进行下钻分析直至定位到具体对象。

并且,针对告警重要程 度进行告警层级区分,对不同机房和告警应用策略类型占比 也做了差异化处理,并且可以统计机房内部业务网络分区告警分布情况,可更细粒度定位告警来源区域和类型。

综上,博睿数据不仅可以为客户清晰直观监控每个场景的网络情况,问题出现时直观展示在监控界面上; 而且可以帮助券商提高客户的排障能力,并对历史问题提供了回溯功能,责任界定更清晰。