触屏网站,关于申请建设网站申请报告,做ps兼职的网站有哪些,正规网店代运营公司阿里妹导读#xff1a;谈及国产自研数据库#xff0c;就不得不提 OceanBase。与很多人想象不同的是#xff0c;OceanBase 并非衔着金钥匙出生的宠儿。相反#xff0c;它曾无人看好、困难重重#xff0c;整个团队甚至数度濒临解散。 从危在旦夕到浴火重生#xff0c;Ocean… 阿里妹导读谈及国产自研数据库就不得不提 OceanBase。与很多人想象不同的是OceanBase 并非衔着金钥匙出生的宠儿。相反它曾无人看好、困难重重整个团队甚至数度濒临解散。 从危在旦夕到浴火重生OceanBase 这十年经历了什么今天我们一起了解它背后不为人知的故事。
OceanBase 是完全由阿里巴巴和蚂蚁金服自主研发、全球首个应用于金融核心业务的分布式关系数据库。OceanBase 的研发始于 2010 年 6 月因为选择从零开始研发之路从一开始就磨难重重中途因为找不到愿意使用的业务团队曾经濒临解散。
最终 OceanBase 还是跨越了死亡之谷在蚂蚁金服实现了全面替代 Oracle成功支撑了过去 5 年“双 11”蚂蚁金服全部核心业务的重压创造了 25.6 万笔 / 秒支付峰值和 4200 万笔 / 秒请求数处理峰值这一业内全新的纪录。自 2017 年开始OceanBase 开始走向外部商用目前已经在数十家商业银行落地其中包括南京银行、浙商银行、苏州银行、人保健康险等。OceanBase 帮助南京银行共同打造“鑫云 ”互金开放平台实现贷款交易处理能力 10 倍提升轻资产模式显著降低成本从原有的 30~50 元 / 账户降低到上线后的 4 元 / 账户。日处理百万笔放款平均处理时间小于 1 秒让老百姓借钱更方便真正实现了普惠金融。
站在现在这个时间点上顾盼今昔蚂蚁金服高级研究员、OceanBase 创始人阳振坤认为OceanBase 的成功其实有行业和时代的必然性。
时 机
2009 年开始大量新的非关系型数据库如雨后春笋般涌出在整个数据库行业掀起了一场空前盛大的 NoSQL 革命如今赫赫有名的 Redis、MongoDB 皆诞生于那一年。NoSQL 的拥护者们积极提倡使用非关系型的数据存储从而获得丰富而随需应变的可伸缩性。这时候的关系数据库早已过了而立之年在此期间虽然曾短暂爆发过一些所谓终结关系数据库的革命但最终都失败了丝毫没有动摇到关系数据库的主导地位。
但这一次似乎与以往不同火热发展的云计算带来了对更大规模数据库的需求而关系数据库的缺点则相应地被越来越多人诟病不能够扩展、容量小、处理能力不够、成本又非常高。在当时的很多人看来关系数据库的末日是真的要来了。2010 年NoSQL 革命愈演愈烈有行业专家发文直指“云计算时代属于 NoSQL关系数据库已经日薄西山”。
那时阳振坤已经做了两年多的自研分布式系统十分看好云计算系统的发展机会。同一年阳振坤加入阿里巴巴开始了分布式关系数据库 OceanBase 的研发。 数据库从诞生起已经有几十年的时间了但基本上它的市场格局就没有多少变化最早起来的几家厂商今天还是占据着统治地位。因为数据库非常难被替换它处在整个产品或者产业链最底层的位置替换风险很大但收益相比起来却小得多。这也是为什么像 IBM、微软这样的后来者也无法取代 Oracle。这就导致了数据库变成了一个门槛极高、强者恒强的领域后来者很难居上。前有 Oracle 挡道、后有 NoSQL 数据库追赶在大部分人看来那时候怎么也不会是自研关系数据库的好时机但阳振坤却不这么想。
加入阿里之后阳振坤发现无论对淘宝还是支付宝关系数据库都扮演着十分关键的角色在使用上根本不可能摆脱。但已有的数据库无论是商业数据库还是开源数据库都有非常多的局限远远无法满足如淘宝、支付宝这样的互联网和金融业务对高扩展、高并发、高可用和低成本的需求。单机数据库已经走到了尽头下一步只能走向分布式而分布式恰好是阳振坤所擅长的。如果能将分布式技术揉到数据库里面解决单机数据库存在的各种问题对当时整个互联网的基础设施都会是一个巨大的帮助和进步。阳振坤认为他们赶上了一个“天时地利人和”的好机会。
“天时”指的是互联网的爆发式增长对数据库的高并发、大数据量提出了很大的需求有了需求去推动就会容易得多“地利”指的是阿里内部从淘宝到蚂蚁金服拥有大量需要使用数据库的场景OceanBase 可以从不是特别重要的应用场景开始尝试一步步地将数据库做成关键系统“人和”指的是当时单机数据库已经走到了尽头下一步一定是走向分布式而当时团队成员大多是研究分布式出身做的就是自己最擅长的工作。用阳振坤的原话就是“这是千载难逢的机会我们一定要做而且一定能做成。”
选 择
“其实绝大部分人都非常聪明或者说智慧都足够但最终能把事情做成的人却不多。有时候大家在想这个人是大聪明那个人是小聪明不是说他的智慧不够。如果一个人把他的智慧放在做应该做的事情、需要做的事情、重要的事情上可能这个人真的就是大聪明。”
“一个不断破格的人”这是早前某次采访中记者对阳振坤的评价。1984 年阳振坤考入北京大学数学系硕士师从本系的张恭庆院士后又转向计算机领域博士师从计算机系的王选院士。需要强调的是他修完大学课程只用了 3 年硕士只用了一年多成为王选院士博士生的时候他只有 24 岁。1995 年其所在团队研究成果获国家科技进步一等奖排名第四1997 年也就是他 32 岁那年被破格晋升为教授。
回想在北大的那些年阳振坤觉得特别感激的是学数学让他有了一个很好的数学基础后来转到计算机系以后碰到了王选老师又打下了一个比较牢靠的计算机基础这才有了他后来的今天。作为对阳振坤影响最大的人恩师王选有两点让他至今受益一是如何判断一件事情是否有价值二是“顶天立地”的技术理念“顶天”就是技术上要不断追求新突破“立地”就是要把技术做成通用产品让整个社会都能普遍使用。
其实 2010 年去淘宝的时候阳振坤根本不知道自己会做什么事情。加入淘宝之后摆在他面前的有两个选择一个是加入正在快速发展的淘宝业务团队去主管技术这是一条已经能看到很大的发展机会、相对轻松的道路另一条是阳振坤后来自己选的从头组建团队做一个技术平台也就是今天我们看到的 OceanBase 数据库。从加入淘宝到选择做自研数据库一共只花了两个星期的时间。 这不是一个容易的选择但阳振坤相信自己的判断“2010 年选这个项目的时候我是觉得这件事情需要做。当时互联网迅速发展带来了对大数据量、高并发的需求大家对传统单机数据库有很大的抱怨觉得它既没有扩展能力又没有高并发的能力成本还非常高但是互联网根本就离不开关系数据库。这件事情怎么看都是一件应该要做、需要做的事情。”阳振坤没有说出来的是这件事到底有多难。
那时候阿里巴巴刚开始要“去 IOE”几乎没人想着说要自己从头做一个数据库。传统关系数据库都是通过外部硬件来保证可用性用便宜的 PC 机替换高端服务器之后硬件更容易出故障了如何保证数据库高可用高可用和数据一致性如何同时保证分布式系统怎么同时实现 CAP 的要求几十年来这么多做数据库的厂商国内国外基本没有人成功过。而且从公司的业务发展的角度也不可能等你几年把数据库做出来再去发展业务更可行的做法是基于开源做出一些东西让业务先往前走。因此 OceanBase 立项之初除了阳振坤和他当时的直属领导其他人对这个项目要么不关心要么不赞成。从零开始自研分布式关系数据库并全面替换 Oracle在当时有多少人会相信这真的能做成呢当时整个淘宝一共只有两三千人而 Oracle 有十几万人就算整个淘宝的人全部去做数据库跟 Oracle 比起来也只是很小很小的一个比例。
在阳振坤看来如果一件事情几乎所有的人都认为它很重要、需要做这件事情就已经不是创新了。当所有人都认为这件事情要做的时候其实做这件事情的时机已经过去了一大半。作为最底层的基础软件设施数据库需要很长时间的积累不可能今年做明年就能真正大规模地用起来。虽然在 2010 年选择做数据库的时候没有太多人看重和支持对于团队来说这可能反而是一件好事。无人关注反倒给了团队几年积累发展的时间。
阳振坤不只要自研还要把 OceanBase 定位成恩师王选所说的“顶天立地”的技术产品——走标准化的路做一个通用的关系数据库产品而不是一个仅仅在公司内部使用的产品。每个公司使用任何产品其实都只用了其中很小的一部分功能如果只做满足公司自用需求的数据库可能只需要投入十分之一、五分之一的人力物力时间。而要做成通用产品就意味着必须实现所有功能这要困难得多团队的投入、花费的精力和时间也要大好多倍。但也因为阳振坤最初的坚持今天的 OceanBase 才得以走出蚂蚁金服走进多家银行系统。不过这都是后话了。
蛰 伏 “如果找不到愿意使用的业务数据库系统是做不下去的。” OceanBase 的第一个客户来自淘宝收藏夹。当时的淘宝收藏夹正处于业务高速发展期数据库的访问量飞快增长面临着第二年服务器数量需要翻一倍甚至几倍的局面。业务方忙于寻找解决方案的时候阳振坤主动找上门去提出了可以用 OceanBase 帮他们解决问题把服务器数量降低一个数量级。四个月出 Demo八个月出试用版一年后系统正式上线淘宝收藏夹就这样成了第一个吃 OceanBase 螃蟹的业务新数据库取得了非常好的效果。这时候是 2011 年收藏夹项目成为了 OceanBase 第一个小小的里程碑。
但在后续一年多的时间里OceanBase 团队一直在寻找更多业务也确实有一些业务用了却再也没有找到像淘宝收藏夹效果这么显著的业务。做数据库难度大、周期长前几年的投入也许有那么一点点产出但其实跟投入比几乎微不足道团队面临的压力可想而知。数据库少不了人力投入OceanBase 团队从最早只有阳振坤一个人后来发展到 2012 年已经有 30 多个人了。占了这么多人头但在公司里却没有足够多、足够重要的业务没能产生足够大的价值和效益。团队陷入了一个比较困难的时期甚至数度濒临解散。 当被问及“中间有没有想过这事如果没做成怎么办”阳振坤回答得云淡风轻“不是每件事都能做成那太难了。如果每件事在做之前都想着它能不能做成那最后做成的事就会很少。”
做数据库就像在黑暗中前行守得住寂寞、担得了压力甚至要有近乎偏执的性格才可能跨越死亡之谷到达最终目的地。阳振坤团队中一位新人曾经向他表达过自己的困惑当时这位新人入职三个月了因为有太多东西要学什么也没做出来而跟他同时入职天猫的新员工才来了一个月做的系统就已经在线上使用了。阳振坤当时给新人讲了一个故事他说“你过三年再看没有人还记得那个同学三年前在天猫上把网页做了什么改版可是三年以后你今天做的东西还会在生产系统中使用。”
破茧
在最困难也最危险的时候团队迎来了一丝转机。2012 年底公司把 OceanBase 整个团队调到了支付宝。支付宝属于金融领域面临的数据库挑战会比其他业务更大这相当于给了 OceanBase 团队一次从头开始的机会。
2013 年夏天支付宝也开始启动“去 IOE”并希望能够把 Oracle 数据库替换掉。阳振坤又一次主动出击向当时的主管、也是现在蚂蚁金服的 CTO 程立自荐了 OceanBase 的解决方案。
金融行业数据库最怕的就是突发故障导致数据丢失涉及到钱的事多了少了都是不可接受的。为了解决高可用与主备库数据一致的矛盾OceanBase 将可用性做到了数据库系统内部用一主两备或一主多备代替一主一备。主库到备库同步的时候不要求同步到每个备库而是同步到包括主库在内的多数库超过半数也就是说总共三个库中如果有两个成功了这个事务就成功了。如果任何一台机器出了问题这个系统的可用性和数据一致性都是可以保证的。
程立认可了阳振坤提出的方案OceanBase 团队开始埋头开发第一个要攻克的目标是支付宝交易库。2014 年双 11OceanBase 迎来了第一次大考。 大促开始前的凌晨各个团队都在自己的作战室里热火朝天地准备。当时任蚂蚁金服董事长的彭蕾去了 OceanBase 团队的作战室问大家“有没有信心”阳振坤跟彭蕾开了个玩笑说“你看我们窗子都已经打开了如果等会出问题我们就准备从这跳下去。”
在一开始的计划里双 11 交易流量的 1% 会切给 OceanBase但因为当时的 Oracle 数据库系统支撑不了汹涌而来的巨大流量最后 OceanBase 成功支撑了 2014 年双 11 10% 的交易流量。经过了双 11 的考验之后OceanBase 得到了更多的认可和支持。后来 OceanBase 团队获得了 2015 年蚂蚁金服的 CEO 大奖这也是第一次由技术团队拿到这个奖。彭蕾希望借这个奖鼓励那些能够沉下心来、扎扎实实地把一项技术做好做扎实的技术人们。 2015 年春夏支付宝交易库和支付库都换成了 OceanBase2016 年支付宝账务系统上线这也标记着 OceanBase 真正在金融系统最核心最关键的领域站住了脚。2017 年OceanBase 开始走出支付宝、走出蚂蚁金服在商业银行推广使用至今已在数十家商业银行上线运行。
从濒临解散到浴火重生OceanBase 已经走了快十年但在自研关系数据库这条漫漫长路上OceanBase 才仅仅走出了一小步。在阳振坤看来OceanBase 现在“开了很大的一朵花但是结了很小的一个果”虽然它已经向所有人证明了通用的分布式关系数据库是能够做成的而且能真正应用在生产系统中但今天 OceanBase 的应用还很有限远远没有充分发挥它的价值。
变局
如今再回看十年前那场轰轰烈烈的 NoSQL 革命很难一语判定它到底成功与否。从好的一面来看在过去十年里NoSQL 数据库确实取得了非常亮眼的成绩在软件工程师阵营里越来越受欢迎其中 MapReduce、Bigtable、Cassandra、MongoDB 等都是其中的佼佼者。然而这两年业界也在重新拥抱 SQL几乎所有的云计算服务提供商都在提供备受青睐的关系型数据库管理服务例如 Amazon RDS、Google Cloud SQL、Azure PostgreSQL。对于亚马逊来说其兼容 PostgreSQL 和 MySQL 的数据库产品 Aurora 一直是 AWS 历史上增长最快的服务。
Gartner 在 2018 年的操作型数据库管理系统OPDBMS魔力象限中推测“到 2020 年关系数据库技术将继续用于至少 70% 的新应用和新项目。” 从上到下依次为2018、2017、2016、2015年Gartner操作型数据库管理系统魔力象限图
以上是 Gartner 过去四年对操作型数据库管理系统的分析其中头部领导者 Oracle 和微软一直稳如磐石。正因为数据库领域的理论和工程实践早已成熟前前后后各家公司做产品和技术的思路都差不多所以很难突破现有产品的框架更难以颠覆已有市场上占领先地位的厂商。
但即使是数据库这样非常成熟的细分领域也发生了不少动荡相比四年前如今活下来的公司只剩下一半谷歌凭借 Spanner 从一招鲜玩家杀入到远见者阿里云一举跻身远见者且拥有最多的 DBMS 服务品种亚马逊连年快速上升如今已经跟 Oracle、微软非常接近。
阳振坤告诉我们OceanBase 当初没有选择基于开源或已有的技术思路开发而是选择走分布式自研这条路虽然走得艰难但做成之后就会成为不可替代的优势。过去这十来年正好是分布式系统发展的十来年转型到分布式已经成为所有人都认可的一个选择。如今以 Google Spanner、蚂蚁金服的 OceanBase 为代表的分布式关系数据库不仅解决了关系数据库的扩展性问题也极大地降低了关系数据库的成本数量级的硬件成本的降低还提升了可用性。
现在兼容 Oracle 的工作是 OceanBase 的重中之重。OceanBase 团队的目标是用两年时间做到 Oracle 业务的平滑迁移不需要修改一行代码、不需要业务做任何调整就能够将数据库迁移过来。
对于数据库的未来阳振坤表示“尽管今天在业界数据仓库主要依赖的不是关系数据库但可以看看 Google。今天 Google 的大数据分析 / 数据库仓库基本都统一到了 Spanner这应该是 5-10 年后产业界的写照。”未来OceanBase 还会走得更快、更远。
原文链接 本文为云栖社区原创内容未经允许不得转载。