文首,思考一个问题:为什么需要 RPC 服务? 在传统的开发模式中,我们通常将系统的各个服务部署在单台机器,随着服务的扩展,这种方式已经完全无法满足系统大规模的扩展需要,分布式系统由此诞生,在分布式系统中,最重要就是各个服务之间的 RPC 调用。 RPC 全称 Remote Procedure Call——远程过程调用,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的方式。简单一点就是:通过一定协议和方法使得调用远程计算机上的服务,就像调用本地服务一样。 通常来说,RPC 的实现方式有很多,可以基于常见的 HTTP 协议,也可以在TCP上层封装自定义协议,常见的 Web Service 就是基于 HTTP 协议的 RPC,HTTP 协议的优点是具有良好的跨平台性,特别适合异构系统较多的公司,但是由于 HTTP 报头较为冗长,性能较差,基于 TCP 协议的 RPC 可以建立长连接,速度和效率明显,但是难度和复杂程度很高。 RPC 的诞生让构建分布式应用更容易,极大的扩大系统的可扩展性,容错性。为复杂业务逻辑的系统进行服务化改造和高可用性升级提供了可能。 RPC 调用的分类方式有很多种。 从通信协议层面可以分为:
从是否跨平台可分为:
从调用过程来看,可以分为同步通信RPC和异步通信RPC:
一个完整的 RPC 框架的架构主要模块如图所示。 RPC 服务方的主要职责是提供服务,供客户端调用访问,服务端会通过一个接收器接受客户端的调用请求,根据相应的 RPC 协议进行解码获取调用方法以及相关参数,当调用完成后,服务器端通过后台处理模块处理完成并将结果返回给客户端。 对于客户端来说,服务调用完全透明,像调用本地服务一样调用远程方法,客户端调用服务时候通过一个远程连接和服务端建立通道,并通过相应的协议进行编码,将调用的方法和相关参数发送给服务方。 上 手 篇 下面我们根据上面的RPC的架构图,对图中的各个模块进行拆解,并解释每个模块的作用。
具体到 JAVA 平台来说,其中的3,4通常使用动态代理实现,5,6,7,8使用 NIO 或者一些高性能 NIO 框架,如 mina,netty 实现。 在进一步拆解了组件并划分了职责之后,这里以一个最简单 Java RPC 框架实现为例,对 RPC 具体逻辑进行分析。 RPC 框架服务发布代码: 服务端发布服务的代码如上,首先校验传入的端口和服务是否合法,然后开启一个 socket 监听,这儿为了简便,没有采用 NIO 方式,同时直接采用 java 的序列化方式,将传入的数据通过反射取出调用的方法和参数,本地执行后将运行结果通过 socket 套接字返回给客户端。 RPC 框架服务调用代码: 框架中客户端调用的代码中,首先校验对应的端口和主机是否合法,然后通过动态代理生成一个代理对象,在代理对象的方法中,拦截调用,通过建立 socket 连接,将方法和参数传递到远端执行并获取远程执行返回结果。 RPC 调用测试: 如上图所示,服务器端发布一个接口服务 HelloService,客户端成功通过 RPC 调用。 思 考 篇 协议头 在上面的示例程序当中,我们仅仅是完成了一个基本的远程调用,并没有实现 RPC 框架中的很多组件功能,从最简单的代码版本中我们可以发现,发起一个 RPC 调用,需要传输的最基本数据如下:
因此,如果要自定义协议实现 RPC,我们必须再协议的消息体中包含这部分数据,另外,我们需要定义一些协议元数据,这些元数据通常放在协议头中,和包含必要参数的协议体一期组成了自定义消息。 元数据通常会包含以下字段,大部分字段只需要1-2位:
具体消息 消息内容在网络上传输需要对其进行编码,这个编码的过程就是序列化过程,显然,对于网络传输的数据,在能够保证信息足够解码的情况下,序列化的大小越小,传输的开销就越小,效率就越高,目前 JAVA 平台常用的序列化方式有:xml,json ,binary(包括 thrift; hession; kryo 等)。 在 RPC 调用中我们推荐使用二进制方式进行序列化,在大部分的测试中,二进制方式序列化具有相当好的表现,另外一个比较有意思的地方是,每一次 JDK 版本的升级,JAVA 自带的序列化方式的效率都有提升。 从前面的示例代码中,我们仅仅简单的考虑了实现了组件中的服务端和客户端,并没有考虑效率问题,在一个完整的 RPC 框架中,我们需要考虑实现并优化调用的每一个地方,同时,为了符合业务需求,需要有很高的可靠性和容错机制。 具体来说,在动态代理模块,我们不会采用 java 自带的动态接口,而是会采用一些性能更高的三方库,在连接通道和连接模块,我们会采用更优秀的三方NIO,如 netty 来实现,在后端处理模块,我们也不会仅仅是执行结果并返回,要考虑更多的东西:
以上的思考大部分要结合运维层面一起考虑,但是 RPC 框架本身也要提供足够的支持才能保证它足够的健壮性。 虽然 RPC 有足够多的优点让你去使用,但是当真正转向服务化的时候,依然有很多需要考虑的地方:
由于网络原因,RPC 服务通常会被本地服务处理慢一个数量级,在比较轻量级的业务和并发量很小的情况下,并不需要 RPC 服务,引入 RPC 服务后,无论是系统的调试,还是线上问题分析都会变得非常复杂,是否引入也需要权衡相关利弊。 本文简单的介绍了 RPC 的基本知识和相关分析以供抛砖引玉,进一步的学习可以参考当前最主流的一些 RPC 框架,如dubbo, protobuff ,thrift 通过对其源码的深入学习,相信能获益匪浅。 本文作者:陈瑜(点融黑帮),现任点融技术部成都后端开发,曾就职于阿里巴巴。目前专注于Java技术,架构,爱好阅读,旅游,运动。 随着点融网新一轮融资,点融网即将开始大规模的扩张,需要各种优秀人才的加入,如果你觉得自己够优秀,欢迎加入我们!获取更多职位信息,请关注点融黑帮。
|
|