分享

使用 Go 语言实现优雅的服务器重启

 quasiceo 2016-06-05

使用 Go 语言实现优雅的服务器重启

2014-12-26 09:52 oschina oschina 字号:T | T
一键收藏,随时查看,分享好友!

Go被设计为一种后台语言,它通常也被用于后端程序中。服务端程序是GO语言最常见的软件产品。在这我要解决的问题是:如何干净利落地升级正在运行的服务端程序。

AD:51CTO 网+ 第十二期沙龙:大话数据之美_如何用数据驱动用户体验

Go被设计为一种后台语言,它通常也被用于后端程序中。服务端程序是GO语言最常见的软件产品。在这我要解决的问题是:如何干净利落地升级正在运行的服务端程序。

image

目标:

不关闭现有连接:例如我们不希望关掉已部署的运行中的程序。但又想不受限制地随时升级服务。

socket连接要随时响应用户请求:任何时刻socket的关闭可能使用户返回'连接被拒绝'的消息,而这是不可取的。

新的进程要能够启动并替换掉旧的。

原理

在基于Unix的操作系统中,signal(信号)是与长时间运行的进程交互的常用方法.

SIGTERM: 优雅地停止进程

SIGHUP: 重启/重新加载进程 (例如: nginx, sshd, apache)

如果收到SIGHUP信号,优雅地重启进程需要以下几个步骤:

1.服务器要拒绝新的连接请求,但要保持已有的连接。

2.启用新版本的进程

3.将socket“交给”新进程,新进程开始接受新连接请求

4.旧进程处理完毕后立即停止。

停止接受连接请求

服务器程序的共同点:持有一个死循环来接受连接请求:

  1. for { 
  2.   conn, err := listener.Accept() 
  3.   // Handle connection} 

跳出这个循环的最简单方式是在socket监听器上设置一个超时,当调用listener.SetTimeout(time.Now())后,listener.Accept()会立即返回一个timeout err,你可以捕获并处理:

  1. for { 
  2.   conn, err := listener.Accept() 
  3.   if err != nil { 
  4.     if nerr, ok := err.(net.Err); ok && nerr.Timeout() { 
  5.        fmt.Println(“Stop accepting connections”) 
  6.        return 
  7.     } 
  8.   }} 

注意这个操作与关闭listener有所不同。这样进程仍在监听服务器端口,但连接请求会被操作系统的网络栈排队,等待一个进程接受它们。

启动新进程

Go提供了一个原始类型ForkExec来产生新进程.你可以与这个新进程共享某些消息,例如文件描述符或环境参数。

  1. execSpec := &syscall.ProcAttr{ 
  2.   Env:   os.Environ(), 
  3.   Files: []uintptr{os.Stdin.Fd(), os.Stdout.Fd(), os.Stderr.Fd()}, 
  4. }fork, 
  5.   
  6. err := syscall.ForkExec(os.Args[0], os.Args, execSpec)[…] 

你会发现这个进程使用完全相同的参数os.Args启动了一个新进程。

发送socket到子进程并恢复它

正如你先前看到的,你可以将文件描述符传递到新进程,这需要一些UNIX魔法(一切都是文件),我们可以把socket发送到新进程中,这样新进程就能够使用它并接收及等待新的连接。

但fork-execed进程需要知道它必须从文件中得到socket而不是新建一个(有些兴许已经在使用了,因为我们还没断开已有的监听)。你可以按任何你希望的方法来,最常见的是通过环境变量或命令行标志。

  1. listenerFile, err := listener.File()if err != nil { 
  2.   log.Fatalln("Fail to get socket file descriptor:", err)}listenerFd := listenerFile.Fd()// Set a flag for the new process start processos.Setenv("_GRACEFUL_RESTART", "true")execSpec := &syscall.ProcAttr{ 
  3.   Env:   os.Environ(), 
  4.   Files: []uintptr{os.Stdin.Fd(), os.Stdout.Fd(), os.Stderr.Fd(), listenerFd},}// Fork exec the new version of your serverfork, err := syscall.ForkExec(os.Args[0], os.Args, execSpec) 

然后在程序的开始处:

  1. var listener *net.TCPListenerif os.Getenv("_GRACEFUL_RESTART") == "true" { 
  2.   file := os.NewFile(3, "/tmp/sock-go-graceful-restart"
  3.   listener, err := net.FileListener(file) 
  4.   if err != nil { 
  5.     // handle 
  6.   } 
  7.   var bool ok 
  8.   listener, ok = listener.(*net.TCPListener) 
  9.   if !ok { 
  10.     // handle 
  11.   }} else { 
  12.   listener, err = newListenerWithPort(12345)} 

文件描述没有被随机的选择为3,这是因为uintptr的切片已经发送了fork,监听获取了索引3。留意隐式声明问题

最后一步,等待旧服务连接停止

到此为止,就这样,我们已经将其传到另一个正在正确运行的进程,对于旧服务器的最后操作是等其连接关闭。由于标准库里提供了sync.WaitGroup结构体,用go实现这个功能很简单。

每次接收一个连接,在WaitGroup上加1,然后,我们在它完成时将计数器减一:

  1. for {  conn, err := listener.Accept() 
  2.   
  3.   wg.Add(1)  go func() {    handle(conn)    wg.Done()  }()} 

至于等待连接的结束,你仅需要wg.Wait(),因为没有新的连接,我们等待wg.Done()已经被所有正在运行的handler调用。

Bonus: 不要无限制等待,给定限量的时间

有time.Timer,实现很简单:

  1. timeout := time.NewTimer(time.Minute)wait := make(chan struct{})go func() { 
  2.   wg.Wait() 
  3.   wait <- struct{}{}}()select {case <-timeout.C: 
  4.   return WaitTimeoutErrorcase <-wait: 
  5.   return nil} 

完整的示例

这篇文章中的代码片段都是从这个完整的示例中提取的:https://github.com/Scalingo/go-graceful-restart-example

结论

socket传递配合ForkExec使用确实是一种无干扰更新进程的有效方式,在最大时间上,新的连接会等待几毫秒——用于服务的启动和恢复socket,但这个时间很短。

这篇文章是我#周五技术系列的一部分,下这个周不会有新的更新了,大家圣诞节快乐。

链接:

— Léo Unbekandt CTO @ Appsdeck

原文链接:http://www.oschina.net/translate/graceful-server-restart-with-go

跳出这个循环的最简单方式是在socket监听器上设置一个超时,当调用listener.SetTimeout(time.Now())后,listener.Accept()会立即返回一个timeout err,你可以捕获并处理:

【编辑推荐】

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多