互联网金融,IT需要什么?
3520
2016-05-31 16:38
文章摘要:1 背景 目前互联网金融的研究工作,多以研究互联网金融的业务模式及互联网金融的未来为主,对支撑未来网金融的技术手段研究在公开文献中的研究则相对不足。本文针对互联网金融目前常见的几种模式,有针对性的对其中所采用的关键技术进行介绍与研究。目前互联网金融按大致可以分为金融互联网、大数据金融及虚拟互联网信用




1 背景

       目前互联网金融的研究工作,多以研究互联网金融的业务模式及互联网金融的未来为主,对支撑未来网金融的技术手段研究在公开文献中的研究则相对不足。本文针对互联网金融目前常见的几种模式,有针对性的对其中所采用的关键技术进行介绍与研究。目前互联网金融按大致可以分为金融互联网、大数据金融及虚拟互联网信用平台三个部分。在金融互联网中,传统金融服务将互联网当作一种业务渠道进行使用,典型代表有网上银行、第三方支付平台等。大数据金融依托海量的数据,通过对数据的分析与整理,基于数据开展创新性的金融服务,典型的应用有阿里小贷、余额宝等。虚拟互联网信用平台通过将传统的线下征信系统转移至线上,有效的降低征信成本,使得更多的小额投融资活动得以实施,典型的应用有P2P网贷、众筹模式等。



        互联网金融技术主要分为两个层面,即互联网业务平台的建立及互联网金融服务的支持性技术。前者包括网站平台的建立、维护等;后者包括针对互联网金融新型业务环境出现的问题,有待解决与研究的一些技术,其中包括针对互联网金融业务新型安全特点所需要的信息安全技术,针对互联网金融新型业务开展所需要的大数据技术、针对开发成本的IOE 技术等。互联网平台的建立技术相对比较成熟,经过市场多 年的发展,有相当多的成熟架构与技术可供选择。这一门类的技术,技术门槛普遍不高,涉及到大量所谓的“沉默技术”,即技术门槛不高但需要通过长期反复实践才能熟练掌握的技术。而另外一些技术,包括信息安全技术、数据分析技术、去IOE 等则必须面对互联网金融时代的新型特点,进行相应的研发与创新。本文以证券基金行业可能基于互联网金融开展的业务为主线,对其中应该采用到的一些技术进行阐述。


2 互联网金融中关键技术

2.1. 信息安全技术

2.1.1. 互联网金融安全背景

互联网金融目前呈现着金融机构互联网化及互联网机构金融化两个趋势。互联网企业与金融企业都在向着之前不属于自己的领域进发,因此不可避免的将面对新型的安全问题。以互联网企业金融化为例,针对 互联网企业的网络攻击的收益随着互联网企业开展金融业务将逐渐增大。传统的网络攻击行为,通常通过诱骗客户的相关个人信息来盗取用户的资产。在互联网金融中,由于金融资产直接依托于互联网上,网络 攻击行为将取得更大、更直接的收益,从利益机制上进一步增强了不法分子从事攻击活动的动机。对于金融机构而言,以互联网为依托开展其核心业务,必然存在着将业务从传统专网转移至公共网络的风险,互 联网金融注重将信息流、物流、资金流数据整合,传统安全领域对公共网络、私有网络的划分,将阻碍数据的流动进而阻碍业务的发展。以银行为例,目前大部分银行已经开展与电商的数据合作,合作双方的IT 基础设施存在着不同程度的对接,不同的安全域定义及安全设计,将有可能导致攻击者通过公网发动攻击,进而威胁到金融专网的问题。除了上述所提到的安全风险外,由于互联网金融活动更加虚拟化,大部分交易行为以电子形式进行并以电子数据形式存储,电子交易数据将比传统的以纸质为基础的交易数据,更容易被修改,造成的危害性更大。 因此,无论是金融行业触“网”,还是互联网企业挖“金”,都将面临以下安全风险:


◆ 直接危胁到信用基础。 与传统的金融业务相似,互联网金融的核心问题仍然是信用问题。互联网的便捷性、匿名性及隐藏性,使得攻击者可以通过相关的网络渗透技术,更加隐藏低成本的攻击互联网金融信用基础。


◆ 数据隐私问题日益突出。 互联网金融业务,尤其是大数据金融开展的一个业务基础在于对海量的用户数据进行分析。大数据的获取、存储、保持及利用,无一不涉及到安全隐私问题。大数据时代强调全社会 信息资源的开放分享和利用开发,而个人信息又涉及到个人隐私问题。如何在保护用户隐私的情况下对用户的数据进行分析,已经成为一个突出的问题。


◆ 传统的安全技术,其效率无法满足大数据时代的要求。 经过几十年的发展,业界开发一系列的包括数据加密、数据校检技术来保护数据的隐私性及不可篡改性,但是此类算法普遍存在算法效率不高的问题,对大数据的处理能力不足。开发一系列安全性高、效率性能可接受的安全算法,已经成为大数据时代的一个迫切问题。


◆ 移动支付的出现,带来了更多新的安全问题。 移动支付基于用户的手持移动终端,比基于PC 机的支付更加方便、快捷,具有广泛的应用场景。但移动终端的开放性导致其更容易受到网络攻击,同时,移动终端的存储及处理能力通常有限,如何在有限的资 源内实现高效有效的安全管理,也是一个不得不面对的问题。证券基金行业在开展互联网金融业务中,亟待解决的安全问题包括:




  • 电子资产的安全保护




  • 电子交易平台的安全保护




  • 电子身份认证的有效性及效率问题




  • 高效的安全算法




  • 数据交换与合作过程中的隐私保护




  • 移动终端的安全与保护




2.1.2. 解决方案

针对互联网金融日益严峻的安全局势,应该加紧新型安全技术的研究、安全基础设施架构建设来解决上述问题。具体措施包括以下几个方面:


◆ 加强信息安全基础设施建设,尤其是CA 认证中心的建设,强化身份识别及认证体系。所谓CA 认证中心,是指负责和发放管理证书的第三方权威机构,并作为可信任的第三方承担公钥合法性检验的机构。CA 基础设施的建立,对于互联网金融具有重要的意义。互联网金融交易主体具有身份虚拟化的特点,采用可信第三方对用户的身份进行电子认证,可以有效的降低平台的认证成本,积累更加真实可靠的用户信用信息, 降低网络活动的匿名性进而增加违法活动的成本。未来,应该利用CA 基础设施平台,建立类似于现实世界上类似于物理身份证的电子身份证体系。CA中心的建设难点包括证书的撤销及挂失、轻量级证书服务等。 所谓证书撤销,是指CA 中心如何高效率的维护与发布用户过期及撤销信息,如何防止证书的滥用。近年来新出现的基于身份的密码体系,也值得引起我们的关注。基于身份的密码体系以用户的个人信息(例如 身份证号码等)作为密钥及身份认证的基础,认证中心通过用户的个人信息自动生成密钥,具有简单、高效、交换少的特点,可以有效的解决CA 中心低效率的问题。基于用户信息的密钥生成方式,贴近现实世界的真实情况,有利于提高用户的客户体验度。基于身份的密码体系的变种——基于属性的密码体系,更是能将用户的多维度度信息嵌入至用户的认证信息中, 有利于金融机构进一步基于用户的电子身份,提供个性化的服务。


◆ 进一步优化网络安全域划分理论。传统的网络安全域通过网络所处的业务环境、网络的使用者情况、网络的重要程度进行划分。随着信息流、物流、资金流三流需求的提出,不同网络间的界限越来越模糊,交 互需求越来越大,因此对安全策略实施的要求越来越高,对安全策略的制定原则与方法论提出了新的要求。结合现有的安全技术及业务特点,进一步创新网络安全域划分理论,有助于解决这一问题。


◆ 高效密码安全算法研究。基于互联网的金融活动,其本质在于利用电子状态的01 序列去表示相应的电子金融资产、电子金融交易。互联网金融活动比以往任何金融活动昜需要信息安全技术的保护,其需求主要体现为保护数据的安全隐私、保护数据不受到非法的不可觉察的篡改。例如,对电子资金帐户的篡改、对交易数据的篡改、对交易行为的抵赖都将为互联网金融带来大量的问题,并最终导致互联网金融信用体系的崩溃。数字加密及签名技术是解决这一问题的有效方案。所谓数字电子签名,是指信息发送方通过生成一段对应于信息的随机系列,并使用相应的的密码手段进行认证的技术,一般采用公钥密码体系进行实现,需要CA 中心发放相应的公钥予以配合。数字签名具有完整性及不可抵赖性的特点。完整性,是指消息接收方可以通过对签名的提取来验证消息在传输过程中是否被非法第三方修改;不可抵赖性,是指信息发送方不能抵赖曾经发出与签署过相应的电子文件。该项技术有利于保证网络虚拟交易的真实有效性,依托公钥基础设施实现。数字签名技术应用于互联网金融的主要问题在于效率,普通的数字签名算法采用复杂的算法(SHA1,MAC 等)生成相应的散列码,算法效率普遍较低,不适用于海量数据的处理。同时,传统的数字签名技术依赖于公钥基础设施进行实现,公钥基础设施成为其安全性的一个瓶颈,开发不依赖于公钥基础设施的签名算法,例如(IBE 算法等),将是未来该项技术应用于实践的重点。


◆ 开发专用的移动终端防护系统。与PC 终端一样,移动终端也面临着同样的安全问题,例如病毒和木马的攻击等。但是移动终端通常基于专用的系统,例如Android 系统等,拥有不同的系统架构及安全特性。例如近年来针对安卓系统的提权攻击等,就是一种新型的攻击方式,通过利用安卓系统权限设计体系的漏洞,攻击者可以获得他所不具备的权限,达到向其指定收款方下达付款指定的命令。同时,移动终端的存储及运行设施相对有限,开发基于移动终端的防护设施时,应该考虑到资源有限这一根本前提。针对移动终端系统架构进行系统的分析与研究,开发高效的安全防护系统,将有利于进一步保护移动支付的安全。


2.2. 大数据技术

2.2.1. 大数据背景

大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据的大,是指数据所具有的量级大、多样化及数据维度高。大数据具有4V 特点, 即Volume、Velocity、Variety、Veracity。大数据首先是指体重大,一般处理规模在10TB 左右,利用普通的数据分析工具很难加以处理其次是大数据的多维化,即指大数据包括了用户很多维的信息,而大部分数据分析算法是维度高度敏感的,很难对上述数据将以处理;多样化,是指数据来源多样,数据种类和格式日渐复杂,半结构与非结构化数据日益增多。大数据技术通过从海量的数据中分析出有用的结果,可以有效的支持证券基金行业开展各种创新型服务。例如,如果将来资金第三方存管政策放开,证券基金行业将可以通过为客户管理投资帐户中的沉淀金来进行现金管理服务。通过用户现金使用数据的分析,可以使基金券商业在不失流动性的情况下合理的为客户管理沉淀资金取得收益。再例如,通过分析用户投资行为及持仓习惯,可以实现无缝向客户推送相应的的个性化金融服务。为了支撑互联网金融在证券基金行业的发展,大数据技术应该集中解决以下几个问 题:




  • 海量数据的采集的准确性




  • 海量数据分析效率




  • 海量数据分析准确性




2.2.2. 大数据关键技术

针对大数据的相关特性及应用场景,从大数据的采集、存储与分析处理的流程出发,大数据的关键技术主要有以下几个方面:


◆ 大数据的采集。大数据的采集是大数据分析的基础,没有数据的采集,就不存在着后续的分析及处理。数据采集机制的设计,直接决定了数据的存储及处理方式,因此,设计合理、可靠的数据采集方式,具有重要的意义。在对大数据进行采集时,应该建立规范的采集流程,保证所采集数据的可靠性与真实性,并在采集前段结数据的完整性进行相应的处理。针对大数据的应用场景与使用特点,设计规范的采集流程,是采集阶段最为关键、也是最需要解决的问题。


◆ 隐私数据挖掘算法的研发。隐私数据挖掘,是指待挖掘的数据由两个不同的实体所掌握,在不向对方提供数据具体内容,保护已方数据隐私的前提下,进行数据挖掘的方法。大数据时代不可避免的带来了数据合作的问题,大数据金融需要掌握用户多维度、全方位的数据,包括信用数据、交易数据、健康数据等,为客户提供个性化的服务,并对客户的风险进行精确的量化分析。现实生活中单一机构很难掌握全部数据,往往只对其中的一部分数据掌握较为全面,因此,跨机构的数据合作成为了一个不可避免的问题。但跨机构的数据合作通常涉及数据隐私权保护的问题,即机构是否有权力将用户数据交予其他机构进行数据挖掘与 分析。隐私数据可以有效的解决这一问题,在隐私数据挖掘中,各参与实体并不需要向其他参与方提供明文数据,相关算法可以基于加密数据对数据集进行分析,得出用户行为的统计结果。隐私数据挖掘算法的 主要问题在于采用了加密技术后会造成算法效率过低,因此,需要我们进一步加快高效率的密码算法的研究,同时,优化数据挖掘算法结构,采用有效的并行及分布式计算技术,也是提高此类算法效率的有效途径。


◆ 大数据的存储。通常情况下,数据可以按照访问频率分为热数据与冷数据,应该将两类数据分别存储,即将热数据存储在价格较高的存储设备上、冷数据存储在价格较低的设备上,以此来降低数据的存储成本。因此,如何高效低成本的将数据进行划分,是大数据存储中一个值得研究的问题。在数据备份方面,通过将数据在不同的设备、不同的地点进行备份,可以保证企业在崩溃或受到伤害后数据仍然可用。大数据时代的数据备份主要难点在于系统平台每天都在产生大量的数据,而出于灾备的要求,不同的数据备份点之间一般不在同一个城市,如何采用有限的数据传输线路进行数据备份,是一个颇具挑战性的问题。同时,数据的存储结构也是在大数据中值得考虑的问题,传统的关系型数据存储不太适用于高维度的非结构化数据存储,如何利用不断涌现的新型数据库技术,将hadoop、NOSQL、 MongoDb 等分布式、KeyValue存储概念应用到金融数据存储服务中,是接下来大数据金融研究的一个热点。


◆ 大数据的分析与提取。该过程是大数据处理最为核心的部分,数据挖掘技术通过几十年的发展,已经开发出了大量的数据挖掘算法,但仍然无法满足大数据时代的处理要求。例如,在非参数估计算法、K-means 算法、支持决策向量机算法中,算法的复杂度普遍达到了O(N2) 或者O(N3) 这个级别,在数据量巨大的情况下,难以进行有效的分析与处理。针对数据量巨大的问题,一方面,可以开发相应的大数据专用处理算法,在牺牲一些其他性能指标的情况下(例如精度等),将算法的效率提高至O(NlogN) 级别,另一方面,可以采用相应的分布式架构对数据进行分析与处理,提高数据分析的效率。谷歌公司开发的MapReduce 架 构,就可以有效的应用在大数据的处理方面。Map-Reduce 编程模型其处理过程主要分为映射(即Map)与化简(即reduce)两个部分。其实现过程为指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(化简)函数,用来保证所有映射的键值对中的每一个共享相同的键组。映射与化简函数由用户进行实现,通过上述操作可以使数据并行化的处理,加快处理速度。


◆ 大数据处理鲁棒性分析。数据处理的鲁棒性是指数据分析算法能够容忍数据的一定缺失与错误。大数据涉及到大量的非结构化数据,数据缺失情况相当严重。可以采用蒙特卡洛等模拟方法对缺失数据进行模拟与生成、使用鲁棒性更强的统计参数及分析算法等解决这一问题。


◆ 业务需求与技术研发的结合。传统的标准化数据分析工具,已经越来越难以满足对大数据的处理要求,由于大数据具有多样化的特点,因此,很难有一款工具像在传统环境下一样,能综合满足更合行业对不 同数据分析的要求。利用现有的数据分析软件作为基础,开发适用于所处机构的数据分析个性化软件,将成为一个趋势。数据分析软件的开发,通常需要业务人员与技术人员的紧密配合,由于业务人员与技术人 员通常不熟悉对方的内容,需求的准确分析与调研将成为大数据处理过程中一个关键的问题。开发与设计一套合理、规范、高效的需求分析与调研机制,将有助于业务需求人员准确的提出业务需求,有利于开发 人员提出最符合业务要求的数据挖掘算法。


◆ 合理的大数据商业模式的建立。大数据技术的发展关键在于建立合理的大数据商业模型,以该商业模型为牵引,引领与整合大数据技术。


2.3. 去IOE 技术

IOE, 是IBM、Oracle、EMC 的缩写,分别代表了传统金融服务业中所使用的服务器设备、数据库设备及存储设备等。IOE 系统以其较高的效率与较高的可靠性大大的支撑了传统金融服务的发展,但该体系也造成了金融信息活动中高成本、长开发周期以及信息设备过度购买等弊端,不利于金融行业应对互联网金融时代低成本、短开发周期的要求。有证据显示,天泓基金在开发余额宝的过程中采用了去IOE 技术,有效的降低了开发成本,缩短了开发周期。去IOE 概念首先由阿里集团提出,通过采用开源技术对系统进行开发,可以有效的降低成本。但在使用开源技术过程中,应该注意到由于开源技术只有一个基本的框架,并没有相应的厂商提供技术支持,因此要建立自己相对成熟的开源技术团队。通常而言,开源软件分为以下几大类:


◆ Demos/"Crippleware" 免费或低费用试用的软件,是商业软件的一部分,它没有自由可用的源码,没有支持,通常缺乏关键特征。


◆ Bundled Software 它由商业软件携带并且不用增加额外的费用,但是它一般具有很有限的使用许可,没有自由可用的源码。 例如:Microsoft Internet Explore. "Consortium-Ware": 源码由公司内部人员共享,但是对公众没有自由可用的源码。例如:Motif. "Non-commercialuse only": 这是可以免费从Internet 网下载的典型软件,甚至连同源码,但是同时它有严格的许可证限制它的使用。


◆ GPL 通用公共许可证("CopyLeft") 禁止派生或分发产品的限制。


对于证券基金行业而言,除了成本之外采用开源软件进行互联网金融活动的优缺点包括以下几个方面:


◆ 质量 研究显示开源软件与别的可比商业软件具有可靠性上的极大优势。更加有效的开发模式,更多的独立同行对代码和设计的双重审查。


◆ 透明度 私有软件有很多“ 阴暗的死角”, 隐藏着许多Bug。源码对于查错和理解产品工作原理来说是很重要的。在大的软件公司,只有极少数人能接触到源码,而这些能接触源码的人通常用户都无法直接接触。能接触源码对于修补安全漏洞来说,也是非常重要的。金融行业由于其活动的特殊性,对透明度有更高的要求,不透明产生的bug,将会让诸如光大事件等乌龙事件不断上演。


◆ 剪裁 信息产品的过度销售是指信息产品公司向客户推荐信息系统时,经常附加一些用户根本不需求的功能。IT 过度销售增加了证券基金公司在开展互联网金融活动中不必要的成本,不利于在成本为王的互联网金融竞争中获胜。开放源码给用户极大自由,使他们能够按照自己的业务需求定制软件。大型组织能从即使很小的定制行为中削减大量开支和人力成本。用户的挑错和改进反过来对标准开放源码软件包也是个贡献。这 在传统的私有软件开发中是不可能得到的。


3 证券基金业对互联网金融技术的应对


如上所述,互联网金融技术主要分为两个层面,即互联网业务平台的建立及互联网金融服务的支持性技术。


前者包括网站平台的建立、维护等;后者包括针对互联网金融新型业务环境出现的问题,有待解决与研究的一些技术,其中包括针对互联网金融业务新型安全特点所需要的信息安全技术,针对互联网金融新型业务开展所需要的大数据技术、针对开发成本的IOE技术等。就沉默技术而言,针对证券基金业技术研发部门普遍规模偏小的现象,可以采用技术外包或者收购相应的互联网公司的方式获得此类技术。市场有大量的相关下游开发企业可供证券基金业选择来从事此业务,提供互联网平台开发服务的行业属于完全竞争类市场,因此证券基金业在此类技术的合作与外包中不用担心受制于人。


大数据等技术作为支撑互联网金融发展的核心技术,直接关系着一个公司在互联网金融竞争中的成败,其中涉及到的技术需求直接关系到公司对互联网金融的战略定位与业务模式发展,因此在此类活动中涉及到的技术采用技术外包合作并不现实。大数据技术的研发与使用需要小而精的研究团队,属于技术领域的”贵族“技术,普通的外包公司也很难在这一方面予以支持。


证券基金业在面对大数据技术时,首先要明确自身对大数据技术的需求与定位。根据自身的市场定位及所掌握的数据资源,建立合理的大数据商业模型。以大数据商业模型为牵引,采取与高校合作及自建研发团队的方式从事大数据技术的相应研究与开发工作。互联网金融时代的信息安全技术所需要的技术更为复杂,所需要的投入大,见效慢,研究性较强。信息安全技术并不直接带来利益,但可以有效的为业务发展保驾护航。按照国际相关经验,在研究与使用此类技术时,出于成本等方面的考虑可以联合整个行业进行相应的技术研究公司,采用共同研分、共同使用的方式开发此类技术。至于IOE 技术,应该广泛加强与开源社区等方面的合作与沟通。



版权声明:

凡本网内容请注明来源:T媒体(http://www.cniteyes.com)”的所有原创作品,版权均属于易信视界(北京)信息科技有限公司所有,未经本网书面授权,不得转载、摘编或以其它方式使用上述作品。

本网书面授权使用作品的,应在授权范围内使用,并按双方协议注明作品来源。违反上述声明者,易信视界(北京)信息科技有限公司将追究其相关法律责任。

标签:

评论