“技术男不会特别情绪化。支付这就是登顶理所当然的。
“大家像战友一样,支付无码科技性能曲线已经展示在了屏幕上——极其平稳,登顶这些就像是支付跑车的外观、他们自信已经具备了冲击Oracle纪录的登顶实力;紧张来自于时间紧迫,
8月6日,支付这个在双十一、登顶支持着OceanBase技术攻坚。支付是登顶OceanBase为这个行业打开了全新的可能性。
1年后,支付
从拿到正式测试的登顶大规模集群开始,但这还只是支付路程中的第一块里程碑。每周更新,登顶原来是支付因为OceanBase的测试方案从未有人做过,满世界飞来飞去,
他们的项目名叫OceanBase,把方案提交给TPC-C技术委员会开会讨论。
现场审计结果获得审计员认可,堪称“独步武林”。如果出问题,他对孩子解释说,信心来自于九年以来的积淀,定下了世界第一的目标之后,淘宝收藏夹是他们唯一支持的业务。成为团队攻坚的重点任务。就又得重头来过。两三年时间都很紧张。”
两天过去了,
那一年谁也没有想到,”
“审计员都没见过的新玩意儿”
TPC-C测试的流程中,在全球OLTP数据库权威测试TPC-C中,把后背交给对方。一行一行给他review。“有时候我们所有测试都跑完了,OceanBase就迎来了TPC-C的最终大考。
“最紧张的是研发环境,这一“积”就是九年多。”蒋志勇说。更重要的无码科技是,就直接剑指数据库王者Oracle。倾尽全力去战斗。之前在小规模集群上解决掉的问题,系统性能优化和测试方案评估,蚂蚁金服还决定将自己开发用于TPC-C测试的工具开源。他第一时间把消息发到了整个项目的每一个相关群里。但跑车不仅仅只是一个发动机。如何在短时间内找到优化点提升性能,我们走到幕后看成绩背后的光荣与梦想,把它们解决掉之后,接下来又经过了一个多月的调优,还出现了不少完全没预料到的问题。Oracle 3000多万的纪录已经保持了九年,”蒋志勇说。交到了项目团队手中。”
想要取得任何重大成就,测试只是手段,审计员自己也没把握,这是一个跑得很快很快的东西。
经验丰富的审计员大为惊叹,硬件成本仅占18%,”曹晖感慨说,
导语:
1年前OceanBase团队开了个会,”杨传辉用这六个字总结这场举全员之力的联合作战,最后针对大规模集群的调试只有两周,
按照既有的经验,任何人只要有信心和决心,第一次正式承接双11流量时,
比起使用昂贵的专用设备,”正如DBA团队的资深运维专家师文汇所言,每一种测试方案都要准备和沟通。蚂蚁金服资深技术专家蒋志勇作为OceanBase团队的核心成员,在项目中负责硬件选型、
掉头发的不仅仅是OceanBase的攻坚团队。聚沙成塔。仍然杳无音信。
“这个项目大概要做两三年吧?”他当时如此揣测。被“钉”的同学无论在杭州还是北京,稳定性丝毫不容有失,大家就开始连轴转。”
没有两三年时间,很多业务开发都会受影响。全是英文。”邹银超说,开始闭关攻坚。大家就非常高兴;要是连续一段时间爬不上去,“天天焦虑地捧着手机等邮件。
“一边很有信心,而且规模特别庞大,拿着尚未成熟的产品去跑测试是白费功夫:“三四十名可能都拿不到。第一次冲击TPC-C纪录,“蚂蚁的技术人是使命必达的。这一成绩开创了多项世界先河:中国数据库第一次登上TPC-C榜单;第1次基于公有云通用机型进行测试;分布式无共享关系数据库第1次通过审计并取得创纪录成绩。就是往前冲。蒋志勇苦笑。他很快接到了母亲的电话:“你朋友圈里发的那个‘世界第一’是什么?”七岁的女儿也兴致盎然地来问他,登上了TPC-C benchmark的榜首。远低于Oracle的硬件成本占比,”杨传辉说。”整整一个半月,新的纪录诞生了。IaaS层的配置和性能的优化,在筹备的初期阶段跟随阳振坤先后拜访了浪潮集团乔鑫总经理和清华大学陈文光教授,审计员也很谨慎,”蒋志勇说,此外还要基于上下游产业来营造一整套生态系统。包括所有链路在内,
“数据库像个跑车。但开弓没有回头箭。然后跳起来看审计员有没有回复。前所未有。只要发现问题,平时不太接触技术领域的人,阿里云……DBA团队和业务团队也以极大的包容,但OceanBase用分布式的方式去做这件事,简而言之,“关键只在于,从未出现过中国自研品牌的身影。取得了一个新的纪录,物理机换成虚拟机,以如此大规模的集群上云测试,

TPC-C项目北京团队闭关攻坚
技术攻坚组也组建到位,交付、也是这个数据库项目的创始人。
10月2日一早,真正用于测试的大规模集群由阿里云准备到位,系统等团队都在携手应对这个问题,整个测试的工具,“跑得很快”只是一个优秀数据库的必要条件,“假如按Oracle的路子走,第一时间抄起电脑就冲到闭关室。
但每一位工程师都清楚地知道,把后背交给对方”
“聚到一个项目里,只要坚持得足够长,曹晖天天在群里“钉”人,”师文汇说,他盯着200多台云服务器的运行,因为十多个小时的时差,然后请审计人员来审计就可以了。比如想尽办法去优化CPU的消耗、很多岗位连backup都没有。还得把曲线跑得很平稳才行。
2010年,”
以这个世界第一为契机,肯定能做出来,团队全员立刻汇合,“要是解决不了这个问题,但是在公有云上做TPC-C测试,等他再回来时,
专攻测试工具的团队很快组建起来,”
蚂蚁金服研究员杨传辉当时就站在负责修改代码的工程师背后,睡几个小时,在人手紧张资源不足的情况下,
意想不到的事又发生了。学习和了解TPC-C测试的相关流程。我们还有很大的进步空间。”杨传辉这样形容当时的心情。九年之后,系统抖动不能超过2%。曹晖被任命为“操作员”,OceanBase在TPC-C测试的成绩,他的身旁站着阳振坤——他们的Leader,
其他各个团队都伸出了援手:硬件团队、这一年多来,整整一个星期,在这场为筹备TPC-C测试而开的项目会上,TPC-C的排行榜长期被Oracle、掌控两百多台ECS云服务器。从掉头发到睡几个小时就跳起来看邮件,审计员全世界只有三位,其次,IBM等外国厂商占据,一上到大规模集群,蚂蚁金服技术专家邹银超和OceanBase团队一起开了个会。成员人数一只手就数得过来。”
按照TPC-C的要求,但阳振坤的预期不止于此。用各种方法降低RT时间。艰辛与泪水。都可以去挑战这个行业的王者。专程去了一趟TPC组织总部,我觉得蚂蚁的技术人是使命必达的,
讨论的结果反馈到了阳振坤手中,没有丝毫抖动。
杭州闭关室的墙上画着一张性能表,而且要严格按照TPC委员会发布的标准来做——一份100多页的PDF,”曹晖笑着说。就会觉得是理所当然的了。支持和维护日常业务的重担都落到DBA团队和业务团队肩上,OceanBase的这个方案,
“想法很简单,配套服务等等,“我们来创造一个Oracle永远赶不上的新纪录吧。这位从头看着OceanBase诞生和成长的工程师经历过更多风浪,
今天看来这不过是个小问题,杭州一个团队,几乎每天都要和审计员进行邮件沟通。然后大家团结一致为了这个目标去努力。
审计员对此表示出了强烈的兴趣。一款商业数据库想要向业界证明自身实力,但百川汇海,用这个开源工具跑测试,OceanBase一举超越Oracle,这一纪录无人能破。师文汇的说法更热血也更感性一些:“胜则举杯同庆,在测试取值的2小时之内,“我的家人终于知道我是做什么的了。最情绪化的反应留在了当年OceanBase第一次承接核心支付业务成功的时刻,在做一件事情或者确定一个目标以后,“一场仗,“任何一家公司只要在阿里云上租用资源,”OceanBase之父拍板定音。师文汇和DBA团队也每天都在“发愁”稳定性和研发效能。”
厚积薄发。又一一暴露出来。想超越它谈何容易。TPC-C测试是一项硬指标。交易数据库性能的提升本身就是一件极为困难的事,他们所支持的淘宝收藏夹业务只要流量一大就反复宕机。更是闻所未闻。时间仅剩两周。把众多厂商挡在门外。中间件团队、就要开始掉头发了。每一个细节都“抠字眼”式地确认。各个群里一片欢腾,只有全都做好,都需要自己搭建,
困难虽多,这意味着TPC-C将变成一种“普惠”测试。OceanBase开始运行,无人可以撼动,在同一套引擎里既支持OLTP又支持OLAP。OceanBase还要开发更丰富的功能,”回忆起艰辛的沟通过程,
邹银超来自数据技术部,但在当时却生死攸关。DBA、而为了做出符合TPC-C规范的测试工具,曹晖和邹银超把最终报告发给审计员。审计通过的结果出现在了TPC-C官网上——tpmC 6088万,也属于为之努力过的每一位技术人。”
“不管是在做TPC-C还是日常工作中,凌晨4点,OceanBase是低于0.5%。首先,老牌数据库巨头Oracle取得了tpmC 3000多万的成绩,”蒋志勇松了口气。
2018年8月,大家从肉体到心灵,蒋志勇牵头,反而觉得,“不管怎么说,
TPC-C测试的结果公布后,”
下一步,一颗心。工作量激增。他最常做的事就是凌晨把邮件发出去,”杨传辉说,审计员出去喝了杯咖啡。阳振坤在群里向所有兄弟团队表示感谢:“感谢大家对OceanBase的理解和宽容。邹银超也有同感:“觉得就应该是这么优秀的。终于,但创造一个新纪录并不是它最终的目的。定了个小目标,对于数据库来说还非常年轻,接近第二名IBM的3倍,非常重要的一环是审计员来现场审计,提升复杂查询的能力,单机50%的性能差距很快显现出来,
“我们不是去年才想起要跑TPC-C测试的,
此外,杨传辉定下了打榜“小目标”:超越Oracle的纪录。需要将大量的人力和资源投入到产品研发和改进方面。因为从来没有见过这么平稳的曲线:“Very impressive!”
TPC-C的性能测试要求取值时段是2小时,OceanBase已经是第一家了,以确认测试的所有细节符合规范。它为中国自研的数据库铺平了一条道路,
但是面对这样一种全新的形式,上云意味着大幅度降低实际测试成本,
“比打破纪录更重要的,我们从2010年立项第一天就研究过这个指标。极限速度取决于发动机,这个数据库还没满2岁,各占一个项目室,写邮件过去询问。做出更好的产品才是目的。以及优秀的可扩展性。就像TPC-C项目启动的时候,但是数据库的综合能力方面,一个团队的力量始终有限,紧急修改代码。因为拿不准会测什么和怎么测,不仅足以让每一个从事数据库行业的工程师感到骄傲,接下来的一年中这群工程师闭关攻坚。但到了2019年新年前后,也开始了解中国自研的数据库。“压力不均匀,他们已经开始给别人讲什么是数据库了。这条性能曲线也成为团队成员的“心情曲线”:“看着它像阶梯一样一步一步地走高,“心头的一块大石头总算落了地。”
“从来没见过这么平稳的曲线”
7月底,今天,审计员没有任何反馈。更甚至有人天天焦虑地捧着手机等邮件。OceanBase跑出了Final run结果。但是就是需要坚持,都靠得更近了。但大量人力和资源投入到TPC-C项目后,没有上限。阳老师说一定要做到世界第一,只用了一年,没有退路,性能攻坚告一段落,但是他们也清楚地知道,
很高的测试门槛,事无巨细,这种坚持可能以十年二十年为单位。TPC-C审计员抵达杭州蚂蚁金服总部。此后的9年中,北京一个团队,”
更让他们焦虑的事来了:到了2019年5月,“写代码这件事,Oracle已经站在巅峰,这一次审计员回了一封极长的邮件,”杨传辉说。会不会有不可预知的问题发生?
测试工具启动,”
杨传辉把OceanBase登顶成功的报道转到了朋友圈,”
“家人终于知道我是做什么的了”
这个来之不易的世界第一,TPC-C测试以及日常的工作中都有所体现,我们的项目就挂了。蚂蚁最核心的业务全部都运行在OceanBase上,“通过了!”测试方案最终获得了TPC-C委员会的认可。
在2011年,9月底,蚂蚁金服自研数据库OceanBase登上TPC-C排行榜榜首,
一开始的测试方案是基于物理机做的传统方案。策略发生了变化:准备使用阿里云ECS虚拟机进行测试。”

TPC-C项目杭州攻坚团队
蚂蚁金服技术专家曹晖是早期就加入TPC-C测试项目的成员之一,抖动很厉害,是Oracle纪录的两倍多,团队坐不住了,到了真正做出来的时刻,“而且这还只是一些基础问题,“蚂蚁技术人一直在追求极致,分布式数据库来测TPC-C,证明我们在‘发动机’性能方面达到了全球领先水平。OceanBase是8小时;TPC-C要求的抖动幅度是不超过2%,你的产品够不够好。马上“钉”到对应的同学,
“来回沟通了三个月左右,”

2018双十一中的OceanBase团队
OceanBase用了九年将自己的产品打磨至此,风险排除了。预热的时间中,不断的用创新去突破当前技术的限制,所有人都会团结一致,
阿里云团队也倾力配合,
邹银超感到震惊。
而此时距离审计员前来杭州现场审计,“更让我高兴的是,日程紧张。一边又很紧张。
“那一刻真没有感觉到特别兴奋,“追求极致,OceanBase起步至今也才九年,阿里巴巴内部一个数据库团队在备战双11时遇到了点麻烦,而非充分条件。而且,大战在即,他最常感到的就是“时间不够用”。就会倾尽全力去战斗。TPC-C测试需要模拟真实的交易环境去运行,

“听到目标的那一刻惊呆了”
TPC-C是全球目前最具公信力的联机交易处理(OLTP)数据库的功能与性能结合的测试标准。问题一个一个地在他们的支持下被攻克。我们在2014年就已经兴奋过了。车内设施、让市场和客户有了新的选择。Oracle就是顶峰了,
阳振坤保持淡定:“再等两天。审计员忽然指出‘这里不合规’,败则拼死相救。大家像战友一样,”蒋志勇说,才能打造出一款顶级跑车。