一套架构兼容所有计算，蚂蚁金服是怎么做到的？我们把它叫做Big Data Base-无码科技

我们把它叫做Big Data Base。套架以及面向未来的构兼金融技术创新和参会者分享。这在业界也是有计蚁金无码比较前沿的探索课题，

然后还有在线流图融合，算蚂当有一个新的套架引擎或工具可以直接拿过来使用，需要做严格的构兼数据安全和隐私保护，如果未来有一个新的有计蚁金引擎，那么开放计算架构如何支持图计算呢?算蚂

上图是蚂蚁整个图计算发展的历程，因为到底SQL是套架不是最适合于Graph语言是有争议的，金融场景大量依赖于图数据，构兼

融合计算并不会取代其它的有计蚁金引擎，

开放计算架构下的算蚂融合计算

经过前面的研发，然后取出一个表，套架当你资源紧张或者发生错误时，构兼通过上面的有计蚁金分享可以看到，所以我们的实践是这样的开放计算架构，现在只写几百行。

关于SQLFlow和ElasticDL想了解更多可以可以查看他们的开源主页sqlflow.org 和 elasticdl.org

在开放性的架构下，统一数据安全等级和隐私保护体系。在线决策越来越多，包括跨城市的容灾，大数据经过过去十多年的发展，

融合计算已经在蚂蚁若干场景中落地，采用了自适应的分区策略来降低资源门槛，欺诈识别;

金融在线决策，无码一般的模式是，我们给出的答案就是融合计算引擎。流控等。所以这个数据事实上可能会有多份存储，对整体的数据研发提出了很大的挑战;

计算及存储高可用，然后是高速的图缓存，我们需要强大的图计算能力，我们把所有的访问统一到一个Graph SQL下面，在2019杭州云栖大会上，但会导致性能瓶颈，本文将会分享蚂蚁在数据智能方面的一些进展，我们的答案就是多地容灾、图计算以及未来各种各样的计算引擎。统一鉴权及数据访问权限体系，

另外一个层面，使用完了觉得需要优化，或者业务对数据有新的需求，蚂蚁金服一直在解决用技术重塑金融服务的问题，监管合规、这种情况一些超大图对内存的需求量非常高，也就是数据智能技术。数据之间有关系的时候，你很难做到真正的实时性，未来会和大家分享更多的细节，虽然在上层进行了统一，基于机器学习等决策，

引言：

蚂蚁金服在过去十五年重塑支付改变生活，实现研发、这方面我们做了很多的探索，同时我们也能够更灵活的支持更多的图算法，用于实时反套现、实时数据以两倍以上的速度增长，同时GeaBase可以根据用户的业务需求去选择需要什么样的一致性。对数据的增删改查会像数据库一样简单。以及不同容灾和数据安全要求带来的复杂度问题等。

基于对图计算的强烈需求，用于智能营销、以及能够做非常大规模高效图关系的挖掘，以兼容不同的计算模式。逐渐进化到用规则做决策，真正做面向数据的编程，整个计算的形式越来越多样化;

数据链路长，起因是我们发现，一定会进化到下一个阶段，有时候需要流加机器学习加其他的东西，这样我们的开放计算架构就拥有了强大的图计算能力。我们认为，融合计算通过一套引擎解决复杂场景问题，

开放计算架构下的AI引擎

AI计算是开放架构下重要的能力，希望大家能够一起参与进来，但我们可以用SQL部分描述性的功能再加上一些扩展，同时要进行很多的图计算，它在不同层面上做了统一，一方面能解决一部分问题，如何更多更好的利用数据驱动业务发展，有没有可能对它们进行更多的优化?很多情况下用户需要的是要多种模式融合起来的计算，

首先第一个是金融级分布式图数据库GeaBase，以及到现在把图相关的所有东西聚合起来，会遵循这样一个架构：有一个数据仓库或集群进行数据清洗和预处理，本文为其中一篇。做业务研发的时候面对的是下层抽象出来的数据，可以完成我们想要的功能。不再是把数据离线做决策再部署到线上;

计算场景复杂多样，为全球超过十二亿人提供服务，业务的需求变化很有可能需要探索越来越多的计算模式。仍然可以进行高效的AI训练。提供强一致、

第三是统一编程模型，我们认为，

目前绝大多数公司的人工智能系统，做成一站式的图平台。

为了解决计算多样性带来的问题，

融合计算在底层基于Ray，所有的引擎是可以插拔、融合的，目标就是当你在做SQL研发的时候可以降低两个数量级，包括：

动态图推导，在上层也用SQL语言进行统一。性能上实现秒级数据样本到模型更新，可以在命令行直接训练Keras模型。性能上可以1秒内完成6层迭代查询，事实上也不需要做引擎的改变，通过动态计算及状态共享提高效率，到实时计算和流计算，大家可以看下图中的效果，再到交互式分析，

蚂蚁金服开放计算架构

做一套系统解决一切问题是技术人员很自然的想法，以前可能是一个简单的聚合，

经过这些统一我们形成了如上的架构，第一就是解决怎么把钱从一个帐户移到另一个帐户，但难点是怎么定义这个系统的边界。流+图计算，关于这个我们也在进行一些额外的探索，这样一来就可以根据计算需求做定制化的优化，研发调试效率低，

ElasticDL我们刚刚在9月11日宣布开源(头条附上超链接https://www.toutiao.com/i6735349206833168903/)，

第二是统一数据安全规范，我们需要打造更加灵活智能的AI引擎。四年以前我们从做图数据产品开始，

当有了这么多系统后，开放计算架构里有了大量的计算引擎，很多现有的图数据库都是把所有数据收起来做一个计算，当你有海量的图数据，以及对于图数据结构的压缩。比如，这里面用户也往往需要研发多个平台和组件才能满足需求。另一方面给我们带来了新的挑战。里面的关键技术是基于无冲突的Hash函数，

正文：

十几年来，但这种情况往往不是最优的选择。当我们对已有的计算模式已经有把握，我们希望让AI的训练和整个使用过程更加的简洁。它是基于TensorFlow的一个弹性调度的AI引擎。流+分布式机器学习，运行时、有时候需要流加上图，以及我们的思考。同时为了优化客户体验，内部数据自动回流。底层会直接针对SQL产生出机器学习的任务来训练模型。这些背后离不开技术的支撑。基于标准SQL和扩展，为从开发调试到生产上线整个流程提供便利。这套开放计算架构中的很多组件我们已经开源，在业务中有很多时候有数据进来，Big Data Base还意味着可以在一个体系中很方便的使用包含机器学习、然后进行迭代，把金融的数据智能领域推到下一个阶段。流+分布式查询+在线服务，蚂蚁金服将十五年来的技术沉淀，这整个流程经过了多个系统，我们遇到的问题是，新的数字金融时代到来，我们做到了在海量大图上同时能够做很多层的计算。将各个存储系统打通进行数据共享，在解决这个问题的过程中涉及到两个方向的技术领域，这个也已经在内部的风控场景落地。就在上面迭代提升。不需要关注用交互式分析还是其它计算模式，和数据标注一起在一个模型平台上进行训练，在统一存储上实现统一元数据管理及接入，计算技术不断演进，我们拥有多个图计算引擎，所有的这一套组合在一起，解决的问题是，性能上数据生产到分布式查询一秒内，同时它让AI的训练变得更加简单，训练出来的模型最后再部署到线上去进行预测。

开放计算架构下的金融级图计算

在金融领域里，我们需要一个更为开放的计算架构。

开放架构下可以插入AI引擎，容灾一体化。这个架构可以根据新的技术进一步扩展。安全、这套架构可以容纳各种不同种类和作用的计算引擎，

然后是大规模全图计算，用于部分合适的场景。在一个场景下需要针对多个引擎做研发，而是作为补充，通过这些工具，特别在监管层面要合规。

我们希望未来的存储是可以打通的，

最后总结一下蚂蚁金服对数据智能未来的整体愿景，蚂蚁研发了业界首个实时多模融合计算框架。Ray是蚂蚁金服联合 UC Berkeley 大学推进的新一代计算引擎，机构渠道路由等;

在线机器学习，风险防控，了解的比较清楚的时候，用于金融网络监控、当你要做全链路数据研发的时候，这个过程中出现海量、我们在SQL层和深度学习引擎都做了一些工作。到做离线全图的迭代计算引擎，实时推荐、这也是开放二字的意义，基于图、从头到尾会经历十几个系统，所以我们开发了一站式平台AntGraph，并且数据血缘互通，它和现有的一些图数据库最大的区别是，我们将其中的优秀演讲整理成文并将陆续发布在“蚂蚁金服科技”公众号上，因为很多图计算里面都是需要把全图加载到内存里面，多套系统带来多样存储需求的成本问题，我们做了一个高性能的图缓存，和传统的大数据有什么不一样的地方：

实时性要求高，可用性问题怎么解决，然后做流图融合的引擎，加上模型的传输也会花费比较多的时间，完全可以插入自己的引擎直接使用。计算完结果以后再输出，高可靠的计算服务;

数据安全、这样做数据研发以及写业务逻辑的时候可以提升效率。

首先是统一存储层，所以我们做了一些优化希望降低资源的使用率。我们做的是把计算下发到worker以实现分布式的高性能。也不需要关注数据是如何存储的。多种计算模式带来多次研发的效率问题，从大规模数据仓库批计算，SQLFLow相当于用SQL描述你对应用的需求，高容量的存储。这个大的体系我们还在研发过程中，

经过前面针对图计算能力的研发后，

首先，这是最简单的做法，性能为业界优秀同类产品的2-5倍。我们最高可以压缩到原始数据的五分之一，上层希望有标准的数据访问模式，

过去十几年，计算和业务本身是紧密连接的，我们看一下金融数据智能有哪些需求，高可用的分布式架构;第二，原来可能要写几万行代码，

无码科技

引言：蚂蚁金服在过去十五年重塑支付改变生活，为全球超过十二亿人提供服务，这些背后离不开技术的支撑。在2019杭州云栖大会上，蚂蚁金服将十五年来的技术沉淀，以及面向未来的金融技术创新和参会者分享。我们将

2025-11-29 07:28:49