Nelle ultime 3 settimane abbiamo testato Nginx come bilanciamento del carico. Attualmente non riusciamo a gestire più di 1000 req/sec e 18K connessioni attive. Quando arriviamo ai numeri precedenti, Nginx inizia a bloccarsi e restituisce i codici di timeout. L'unico modo per ottenere una risposta è ridurre drasticamente il numero di connessioni.Nginx Bilanciamento del carico del traffico ad alto volume
Devo notare che i miei server possono gestire e gestiscono questa quantità di traffico su base giornaliera e al momento utilizziamo un semplice bilanciamento del Rubin DNS.
Stiamo utilizzando un server dedicato con il seguente HW:
- Intel Xeon E5620 CPU
- 16 GB di RAM
- 2T SATA HDD connessione
- 1 Gb/s
- OS: CentOS 5.8
Abbiamo bisogno di bilanciamento del carico 7 server in esecuzione su Tomca t6 e gestione di oltre 2000 req/sec su tempi di punta, gestendo le richieste HTTP e HTTPS.
Durante l'esecuzione il consumo della CPU di Nginx è di circa il 15% e la RAM utilizzata è di circa 100 MB.
Le mie domande sono:
- ha uno qualsiasi cercato di caricare bilanciare questo tipo di traffico utilizzando nginx?
- Pensi che nginx possa gestire questo tipo di traffico?
- Avete idea di cosa può causare l'impiccagione?
- Mi manca qualcosa sulle mie configurazioni?
Qui di seguito sono i miei file di configurazione:
nginx.conf:
user nginx;
worker_processes 10;
worker_rlimit_nofile 200000;
error_log /var/log/nginx/error.log warn;
pid /var/run/nginx.pid;
events {
worker_connections 10000;
use epoll;
multi_accept on;
}
http {
include /etc/nginx/mime.types;
default_type application/octet-stream;
log_format main '$remote_addr - $remote_user [$time_local] "$request" '
'$status $body_bytes_sent "$http_referer" '
'"$http_user_agent" "$http_x_forwarded_for"';
#access_log /var/log/nginx/access.log main;
access_log off;
sendfile on;
tcp_nopush on;
keepalive_timeout 65;
reset_timedout_connection on;
gzip on;
gzip_comp_level 1;
include /etc/nginx/conf.d/*.conf;
}
servers.conf:
#Set the upstream (servers to load balance)
#HTTP stream
upstream adsbar {
least_conn;
server xx.xx.xx.34 max_fails=2 fail_timeout=15s;
server xx.xx.xx.36 max_fails=2 fail_timeout=15s;
server xx.xx.xx.37 max_fails=2 fail_timeout=15s;
server xx.xx.xx.39 max_fails=2 fail_timeout=15s;
server xx.xx.xx.40 max_fails=2 fail_timeout=15s;
server xx.xx.xx.42 max_fails=2 fail_timeout=15s;
server xx.xx.xx.43 max_fails=2 fail_timeout=15s;
}
#HTTPS stream
upstream adsbar-ssl {
least_conn;
server xx.xx.xx.34:443 max_fails=2 fail_timeout=15s;
server xx.xx.xx.36:443 max_fails=2 fail_timeout=15s;
server xx.xx.xx.37:443 max_fails=2 fail_timeout=15s;
server xx.xx.xx.39:443 max_fails=2 fail_timeout=15s;
server xx.xx.xx.40:443 max_fails=2 fail_timeout=15s;
server xx.xx.xx.42:443 max_fails=2 fail_timeout=15s;
server xx.xx.xx.43:443 max_fails=2 fail_timeout=15s;
}
#HTTP
server {
listen xxx.xxx.xxx.xxx:8080;
server_name www.mycompany.com;
location/{
proxy_set_header Host $host;
# So the original HTTP Host header is preserved
proxy_set_header X-Real-IP $remote_addr;
# The IP address of the client (which might be a proxy itself)
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_pass http://adsbar;
}
}
#HTTPS
server {
listen xxx.xxx.xxx.xxx:8443;
server_name www.mycompany.com;
ssl on;
ssl_certificate /etc/pki/tls/certs/mycompany.crt;
# Path to an SSL certificate;
ssl_certificate_key /etc/pki/tls/private/mycompany.key;
# Path to the key for the SSL certificate;
location/{
proxy_set_header Host $host;
# So the original HTTP Host header is preserved
proxy_set_header X-Real-IP $remote_addr;
# The IP address of the client (which might be a proxy itself)
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_pass https://adsbar-ssl;
}
}
server {
listen xxx.xxx.xxx.xxx:61709;
location /nginx_status {
stub_status on;
access_log off;
allow 127.0.0.1;
deny all;
}
}
sysctl.conf:
# Kernel sysctl configuration file for Red Hat Linux
#
# For binary values,
0 is disabled, 1 is enabled. See sysctl(8) and
# sysctl.conf(5) for more details.
# Controls IP packet forwarding
net.ipv4.ip_forward = 0
# Controls source route verification
net.ipv4.conf.default.rp_filter = 1
# Do not accept source routing
net.ipv4.conf.default.accept_source_route = 0
# Controls the System Request debugging functionality of the kernel
kernel.sysrq = 1
# Controls whether core dumps will append the PID to the core filename
# Useful for debugging multi-threaded applications
kernel.core_uses_pid = 1
# Controls the use of TCP syncookies
net.ipv4.tcp_syncookies = 1
# Controls the maximum size of a message, in bytes
kernel.msgmnb = 65536
# Controls the default maxmimum size of a mesage queue
kernel.msgmax = 65536
# Controls the maximum shared segment size, in bytes
kernel.shmmax = 68719476736
# Controls the maximum number of shared memory segments, in pages
kernel.shmall = 4294967296
fs.file-max = 120000
net.ipv4.ip_conntrack_max = 131072
net.ipv4.tcp_max_syn_backlog = 8196
net.ipv4.tcp_fin_timeout = 25
net.ipv4.tcp_keepalive_time = 3600
net.ipv4.ip_local_port_range = 1024 65000
net.ipv4.tcp_rmem = 4096 25165824 25165824
net.core.rmem_max = 25165824
net.core.rmem_default = 25165824
net.ipv4.tcp_wmem = 4096 65536 25165824
net.core.wmem_max = 25165824
net.core.wmem_default = 65536
net.core.optmem_max = 25165824
net.core.netdev_max_backlog = 2500
net.ipv4.tcp_tw_recycle = 1
net.ipv4.tcp_tw_reuse = 1
Qualsiasi aiuto, guida, idee saranno molto apprezzate.
Si stanno apportando queste modifiche sia al server di bilanciamento del carico che al server di backend o uno o l'altro? –
Maggiori dettagli, per favore. Ogni server nginx ottiene queste regolazioni, se ad alto volume. – chrislovecnm
Suppongo che se avessi server di bilanciamento del carico del database (pgpool, non un server nginx) anch'esso dovrebbe acquisire le impostazioni considerando che la connessione al database verrebbe utilizzata per ogni singola richiesta. Al contrario, la connessione tra pgpool e postgres non assumerebbe queste impostazioni perché esiste una connessione persistente stabilita tra pgpool e postgres quindi non una nuova connessione tcp stabilita per ogni richiesta di database. Questo suono è corretto? –