曾国藩:一勤天下无难事

深入 Nginx 之配置篇

2019.03.20

注:原文链接:http://tenpercent.top/2019/02/15/learn-nginx-configuration/

常用配置项

在工作中,我们与 Nginx 打交道更多的是通过其配置文件来进行。那么掌握这些配置项各自的作用就很有必要了。

首先,nginx.conf 的内容通常是这样的:

...              
...            #核心摸块
events {        #事件模块

...
}
http {     # http 模块
    server {      # server块

        location [PATTERN] {  # location块

            ...
        }
        location [PATTERN] {

            ...
        }
    }
    server {
    ...
    }

}
mail {     # mail 模块

    server {    # server块
        ...
    }
}

我们依次看一下每个模块一般有哪些配置项:

核心模块

user admin; #配置用户或者组。
worker_processes 4; #允许生成的进程数,默认为1 
pid /nginx/pid/nginx.pid; #指定 nginx 进程运行文件存放地址 
error_log log/error.log debug; #错误日志路径,级别。

事件模块

events { 
    accept_mutex on; #设置网路连接序列化,防止惊群现象发生,默认为on 

    multi_accept on; #设置一个进程是否同时接受多个网络连接,默认为off 

    use epoll; #事件驱动模型select|poll|kqueue|epoll|resig

    worker_connections 1024; #最大连接数,默认为512
}

http 模块

http {
    include       mime.types;   #文件扩展名与文件类型映射表

    default_type  application/octet-stream; #默认文件类型,默认为text/plain

    access_log off; #取消服务日志    
    sendfile on;   #允许 sendfile 方式传输文件,默认为off,可以在http块,server块,location块。

    sendfile_max_chunk 100k;  #每个进程每次调用传输数量不能大于设定的值,默认为0,即不设上限。

    keepalive_timeout 65;  #连接超时时间,默认为75s,可以在http,server,location块。
    server 
    {
            keepalive_requests 120; #单连接请求上限次数。

            listen 80; #监听端口

            server_name  127.0.0.1;   #监听地址      

            index index.html index.htm index.php;

            root your_path;  #根目录

            location ~ \.php$
            {
                fastcgi_pass unix:/var/run/php/php7.1-fpm.sock;

                #fastcgi_pass 127.0.0.1:9000;

                fastcgi_index index.php;

                include fastcgi_params;
            }
    }
}

配置项解析

  • worker_processes

    worker_processes 用来设置 Nginx 服务的进程数。该值推荐使用 CPU 内核数。

  • worker_cpu_affinity

    worker_cpu_affinity 用来为每个进程分配CPU的工作内核,参数有多个二进制值表示,每一组代表一个进程,每组中的每一位代表该进程使用CPU的情况,1代表使用,0代表不使用。所以我们使用 worker_cpu_affinity 0001 0010 0100 1000;来让进程分别绑定不同的核上。默认情况下worker进程不绑定在任何一个CPU上。

  • worker_rlimit_nofile

    设置毎个进程的最大文件打开数。如果不设的话上限就是系统的 ulimit –n的数字,一般为65535。

  • worker_connections

    设置一个进程理论允许的最大连接数,理论上越大越好,但不可以超过 worker_rlimit_nofile 的值。

  • use epoll

    设置事件驱动模型使用 epoll。epoll 是 Nginx 支持的高性能事件驱动库之一。是公认的非 常优秀的事件驱动模型。

  • accept_mutex off

    关闭网络连接序列化,当其设置为开启的时候,将会对多个 Nginx 进程接受连接进行序列化,防止多个进程对连接的争抢。当服务器连接数不多时,开启这个参数会让负载有一定程度的降低。但是当服务器的吞吐量很大时,为了效率,请关闭这个参数;并且关闭这个参数的时候也可以让请求在多个 worker 间的分配更均衡。所以我们设置 accept_mutex off;

  • multi_accept on

    设置一个进程可同时接受多个网络连接

  • Sendfile on

    Sendfile是 Linux2.0 以后的推出的一个系统调用,它能简化网络传输过程中的步骤,提高服务器性能。 不用 sendfile的传统网络传输过程:硬盘 >> kernel buffer >> user buffer >> kernel socket buffer >> 协议栈

    用 sendfile()来进行网络传输的过程: 硬盘 >> kernel buffer (快速拷贝到 kernelsocket buffer) >> 协议栈

  • tcp_nopush on

    设置数据包会累积一下再一起传输,可以提高一些传输效率。 tcp_nopush 必须和 sendfile 搭配使用。

  • tcp_nodelay on

    小的数据包不等待直接传输。默认为on。看上去是和 tcp_nopush 相反的功能,但是两边都为 on 时 nginx 也可以平衡这两个功能的使用。

  • keepalive_timeout

    HTTP 连接的持续时间。设的太长会使无用的线程变的太多。这个根据服务器访问数量、处理速度以及网络状况方面考虑。

  • send_timeout

    设置 Nginx 服务器响应客户端的超时时间,这个超时时间只针对两个客户端和服务器建立连接后,某次活动之间的时间,如果这个时间后,客户端没有任何活动,Nginx服务器将关闭连接

  • gzip on

    启用 gzip,对响应数据进行在线实时压缩,减少数据传输量。

  • gzip_disable “msie6”

    Nginx服务器在响应这些种类的客户端请求时,不使用 Gzip 功能缓存应用数据,gzip_disable “msie6”对IE6浏览器的数据不进行 GZIP 压缩。

常用的配置项大致这些,对于不同的业务场景,有的需要额外的其他配置项,这里不做展开。

其他

http 配置里有 location 这一项,它是用来根据请求中的 uri 来为其匹配相应的处理规则。

location 查找规则

location  = / {
# 精确匹配 / ,主机名后面不能带任何字符串
[ config A ]
}
location  / {
# 因为所有的地址都以 / 开头,所以这条规则将匹配到所有请求
# 但是正则和最长字符串会优先匹配
[ config B ]
}
location /documents/ {
# 匹配任何以 /documents/ 开头的地址,匹配符合以后,还要继续往下搜索
# 只有后面的正则表达式没有匹配到时,这一条才会采用这一条
[ config C ]
}
location ~ /documents/Abc {
# 匹配任何以 /documents/Abc 开头的地址,匹配符合以后,还要继续往下搜索
# 只有后面的正则表达式没有匹配到时,这一条才会采用这一条
[ config CC ]
}
location ^~ /images/ {
# 匹配任何以 /images/ 开头的地址,匹配符合以后,停止往下搜索正则,采用这一条。
[ config D ]
}
location ~* \.(gif|jpg|jpeg)$ {
# 匹配所有以 gif,jpg或jpeg 结尾的请求
# 然而,所有请求 /images/ 下的图片会被 config D 处理,因为 ^~ 到达不了这一条正则
[ config E ]
}
location /images/ {
# 字符匹配到 /images/,继续往下,会发现 ^~ 存在
[ config F ]
}
location /images/abc {
# 最长字符匹配到 /images/abc,继续往下,会发现 ^~ 存在
# F与G的放置顺序是没有关系的
[ config G ]
}
location ~ /images/abc/ {
# 只有去掉 config D 才有效:先最长匹配 config G 开头的地址,继续往下搜索,匹配到这一条正则,采用
    [ config H ]
}

正则查找优先级从高到低依次如下:

  • " = " 开头表示精确匹配,如 A 中只匹配根目录结尾的请求,后面不能带任何字符串。
  • " ^~ " 开头表示uri以某个常规字符串开头,不是正则匹配
  • " ~ " 开头表示区分大小写的正则匹配;
  • " ~* " 开头表示不区分大小写的正则匹配
  • " / " 通用匹配, 如果没有其它匹配,任何请求都会匹配到

负载均衡配置

Nginx 的负载均衡需要用到 upstream 模块,可通过以下配置来实现:

upstream test-upstream {
    ip_hash; # 使用 ip_hash 算法分配

    server 192.168.1.1; # 要分配的 ip
    server 192.168.1.2;
}
server {
    location / {       
        proxy_pass http://test-upstream;
    }

}

上面的例子定义了一个 test-upstream 的负载均衡配置,通过 proxy_pass 反向代理指令将请求转发给该模块进行分配处理。

注:原文链接:http://tenpercent.top/2019/02/15/learn-nginx-configuration/