大师兄

加餐 | 谈谈我所经历过的RPC

你好,我是何小锋。上一讲我们学习了如何在线上环境里兼容多种RPC协议,目的就是为了能够平滑地升级线上环境中已经存在的RPC框架,同时我们也可以利用多协议的特点来支持不同的使用场景。

以上就是我们整个专栏关于技术内容的最后一讲了,很幸运能够和你一起携手并肩走过这些日子,这段时间我们跨了新年,也经历了让人猝不及防的新冠肺炎。现在我才发现原来能够自由地呼吸新鲜空气也是一种幸福,祝你平平安安度过这段艰难的日子,期待我们能早日摘下口罩。为了感谢你这些日子的陪伴,今天我们来换换脑子,聊一些轻松的话题。我就和你分享分享我所经历过的RPC框架吧。

与RPC结缘

我1998从大学毕业的时候,互联网并不是像今天这样如火如荼地进行着。那时候大部分IT公司都在耕耘数字化办公相关领域,所以大学毕业的时候我也就随了大流,进入了一个从事办公软件开发的公司,也就是我们今天经常说的“传统软件行业”。

后来随着互联网的快速普及,各个行业都想借着这个机会跟互联网发生点关系,因为大家都知道互联网代表着未来,在咱国内借助互联网技术发展最快的行业代表就是电商和游戏。

得益于互联网的普及,各个互联网公司有关技术的文章也是扑面而来,比如A公司因为流量激增而导致整站长时间瘫痪,B公司因为订单持续上涨而导致数据库压力太大等等。每当我看到类似技术文章的时候,我都在想自己什么时候也可以遇到能用技术优化的方式来解决的问题呢。后来发现这些“设想”在我当时所在的行业里很难体会到,所以2011年我毅然选择了加入京东。

那时候我们公司刚好处于一个业务高速发展期,但系统稳定性相比今天来讲的话,还处于一个比较稚嫩的阶段。在日常工作中,我们的研发人员不仅要面对来自业务方需求进度的压力,还要面对因为线上业务增长而导致的系统压力。这样的双重压力对我来说很新鲜,这种体验是我之前从未有过的,这让我感到很兴奋。

之前我自己也做了很长一段时间的业务系统开发,虽然积累了不少实用的编程技巧,也认真阅读过国内外很多优秀的开源代码,包括像Spring、Netty等等这样优秀的框架,但因为从来没有经历过这么多系统之间复杂调用的场景,所以在入职后的一段时间里,我的内心一直处于忐忑状态。

得幸于同事的热情帮助,我很快地就融入了团队氛围。因为我们大团队是负责整个公司基础架构的,可以简单理解成我们就是负责公司PaaS平台的建设,既然是P,aaS平台那肯定少不了中间件,而中间件里面最核心的应该就是RPC了,因为RPC相对其它中间件来说,使用频率是最高的,也是我们构建分布式系统的基石。

从此我就踏上了RPC这条“不归路”了,当然并不是因为这是条绝路,而是这条路一直充满着挑战,并没有让我觉得有停下来的想法。

使用过的RPC

因为我工作年限比较长,所以编程经历相对也比较丰富,在转Java之前我做过一段时间的.Net。早期因为主要做数字化办公软件,所以那时候用.Net编程的机会比较多,主要是因为很多应用采用.Net相对使用Java来说,开发效率会高很多。但后面应用复杂之后,.Net在性能、可维护性上都不如Java有优势,而且.Net在很长一段时间内并不支持在Linux环境下部署,所以我们就把应用都逐渐改成Java了。

ICE

这就存在一个问题,我们是怎么把.Net应用平滑地切换到Java上呢?原本是.Net应用之间的互相调用,需要改成.Net跟Java之间互相通信。为了解决这个问题,我们当时选择了一个比较古老的RPC框架ICE(https://zeroc.com),可能现在很多人都没有听说过了。

Hessian

后面使用Java开发应用的机会越来越多,而且随着Spring开发方式的大流行,在Java应用里面使用ICE来完成应用之间的RPC调用就变得比较鸡肋了。所以当时我们用了一种新的RPC框架Hessian(http://hessian.caucho.com/),这时我们就把Java应用之间的RPC调用方式改成了Hessian方式。

用Hessian的原因就是因为它可以很好地跟Spring进行集成,对Spring项目的开发人员来说,开发一个RPC接口就变得很容易了,我们可以直接把Java类对外进行暴露,用作RPC接口的定义,而不需要像ICE一样先定义Stub。

单纯的从RPC框架角度出发,Hessian是一款很优秀的产品,即使放到今天,它的性能和鲁棒性都有着很强的参考意义。但当业务发展壮大到一定程度后,应用之间的调用就不仅仅需要考虑用什么RPC框架了,更多的是需要考虑怎么去完成服务治理。

另外一个原因就是因为Hessian是没有服务发现功能的,我们只能通过VIP暴露的方式完成调用,我们需要给每个应用分配一个VIP,把同一接口的所有服务提供方实例挂载到同一个VIP上。这种集中式流量转发架构就会使得提供VIP服务的LVS存在很大的压力,而且集中式流量的转发会让调用方响应时间相对变长。

Dubbo

为了解决类似Hessian这种集中式问题,实现大规模应用服务化的落地,国内的RPC框架Dubbo的做法就显得比较先进了。随着业务越来越复杂,应用之间的调用关系也就变得更加错综复杂,所以后面我们也是选择基于Dubbo进行扩展,以完成RPC通信,而服务发现则通过接入ZooKeeper集群来完成。通过这种现有框架的搭配,我们完成了应用服务化的快速落地,也同时完成了统一公司内部所有应用RPC框架的目标。

但随着微服务理念越来越流行,很多应用的接口也是越拆越细,导致我们ZooKeeper集群需要接入的接口数量越来越多;还有就是因为我们每年的业务量是成倍增长,为了让应用能够抗足够的调用量应用,我们也需要经常扩容,从而导致ZooKeeper集群接入的IP实例数也是呈数量级增长的,这使得我们的ZooKeeper集群负荷特别重。

再有就是Dubbo相对有点复杂,而且性能还有提高空间,这使得我们不得不考虑新的方案。

自研RPC

在这种背景下,我们决定自行研发一套适合自己业务场景的微服务解决方案,包括RPC框架、服务治理以及多语言解决方案。

至此我们自研的RPC就一直平稳地支持着公司内的各种业务。

这几年,在以Kubernetes为代表的基础设施演进过程中,一个重要的关键词就是应用基础设施能力的下沉。在过去我们给应用提供RPC能力的时候,都是需要应用引入Jar包方式来解决的,在RPC里面,我们要把服务发现、路由等一整套RPC解决方案都融入到这个Jar里面去。

未来

目前,Kubernetes已成为基础设施的事实标准。而原先通过Jar包的方式封装的各种基础设施能力,现在全都被Kubernetes项目从应用层拽到了基础设施中。那对于我们RPC来说也是一样,我们需要把非业务功能从传统的RPC框架中剥离出来,下沉到基础设施并且融入基础设施,然后通过Mesh去连接应用和基础设施。

这也是RPC发展的下一个阶段,完成所有应用的Mesh化。所以说,RPC这条路没有尽头,只有不断的挑战和乐趣。希望你也能爱上它!

那最后我还想和你谈谈我对RPC的看法。

可能大家在谈论RPC时候,都想着RPC只是解决应用之间调用的工具。从本质上来讲,这没有什么问题,但在现实中,我们需要RPC解决更多的实际问题,比如服务治理,这些东西都是在使用RPC的过程中需要考虑的问题,所以我个人认为RPC应该是一个比较泛的概念。

当然,可能我们中大多数人现在是没有机会去完整实现一个新的RPC的,这不仅是精力的问题,更多是实际需求的问题,那为什么我们还需要学好RPC呢?我的想法很简单也非常实在,就是因为RPC是我们构建分布式系统的基石,就好比我们每次都是从“Hello World”开始学习一门新的编程语言。期待你能打牢这个基础,总有一天你会体验到它的能量!

今天的特别放送就到这里,也非常期待听到你和RPC的故事。