Linux Ubuntu 系统运维管理实用教程

🐧Linux Ubuntu 系统运维管理实用教程

《Ubuntu 22.04 系统运维管理实用教程》,内容全面、实用、层次清晰,涵盖系统管理、网络配置、安全加固、性能监控、日志分析、自动化维护等关键部分。


作者:Weekend
版本:Ubuntu 22.04 LTS(Jammy Jellyfish)实用运维指南


一、前言

Ubuntu 22.04 是目前最受欢迎的 Linux 服务器发行版之一。其稳定性、安全性和庞大的软件生态使其成为云计算、AI、区块链、容器化部署等场景的首选。

本教程面向日常系统运维人员,涵盖了从系统初始化、用户权限管理、安全防护、网络配置、性能监控到自动化维护的完整操作流程。
适用于云服务器(如 AWS、Aliyun、GCP)、物理主机或虚拟化环境(KVM、VMware、Proxmox)。


二、系统初始化与基础配置

1. 更新系统与基础包

1
2
sudo apt update && sudo apt upgrade -y
sudo apt install vim curl wget net-tools htop unzip git ufw chrony -y

Tips:

  • chrony 用于时间同步,推荐替代传统 ntpd
  • htop 提供更直观的 CPU/内存监控。

2. 设置主机名与 Hosts

1
2
sudo hostnamectl set-hostname ubuntu-node01
echo "127.0.0.1 ubuntu-node01" | sudo tee -a /etc/hosts

查看确认:

1
hostnamectl

3. 用户与权限管理

创建新用户并赋予 sudo 权限:

1
2
sudo adduser admin
sudo usermod -aG sudo admin

安全配置:

1
sudo visudo

添加:

1
admin ALL=(ALL:ALL) NOPASSWD:ALL

⚙️ 推荐:禁用 root SSH 登录,仅允许普通用户登录后 sudo 提权。


三、SSH 与远程登录安全加固

1. 修改 SSH 端口与限制登录

编辑配置文件:

1
sudo vim /etc/ssh/sshd_config

修改以下内容:

1
2
3
4
Port 22
PermitRootLogin no
PasswordAuthentication no
AllowUsers admin

如需修改root密码:

1
sudo passwd root

重启服务:

1
2
sudo systemctl restart ssh
sudo systemctl restart sshd

2. 配置 SSH 公钥认证

在本地机器执行:

1
2
ssh-keygen -t ed25519
ssh-copy-id -p 2222 admin@your_server_ip

验证免密登录后再禁用密码登录。


四、防火墙与安全策略

Ubuntu 默认集成 ufw

1
2
3
4
5
6
sudo ufw default deny incoming
sudo ufw default allow outgoing
sudo ufw allow 2222/tcp
sudo ufw allow 80,443/tcp
sudo ufw enable
sudo ufw status verbose

若需开放更多端口,如容器或应用服务:

1
2
3
4
sudo ufw allow 30000:32767/tcp
sudo ufw allow 30000:32767/udp
sudo ufw allow 32000/tcp
sudo ufw reload

本地检查端口开放情况

1
sudo ss -tunlp | grep 32000

检查端口可达性

1
nc -vz <IP> 32000

🔒 建议:

  • 若部署容器或分布式应用,可针对内部网段放行端口。
  • 使用 fail2ban 自动封禁暴力破解源 IP:
1
sudo apt install fail2ban -y

五、网络管理与调优

1. 查看网络状态

1
2
3
ip a
ip r
ss -tulnp

2. 配置静态 IP(Netplan)

编辑配置文件:

1
sudo vim /etc/netplan/01-netcfg.yaml

示例:

1
2
3
4
5
6
7
8
9
10
network:
version: 2
renderer: networkd
ethernets:
ens18:
dhcp4: no
addresses: [192.168.1.10/24]
gateway4: 192.168.1.1
nameservers:
addresses: [8.8.8.8,1.1.1.1]

应用配置:

1
sudo netplan apply

六、系统监控与性能分析

1. 实时监控工具

1
2
3
4
top
htop
iostat -x 1
vmstat 1

安装高级工具:

1
2
sudo apt install sysstat glances -y
glances

2. 磁盘与 IO 分析

1
2
3
4
df -h
du -sh /*
lsblk
iotop

💡 建议:定期检查 /var/log/tmp/docker 目录空间占用。


七、日志分析与维护

1. 系统日志路径

  • 系统日志:/var/log/syslog
  • 安全日志:/var/log/auth.log
  • 服务日志:/var/log/nginx//var/log/mysql/
  • 内核日志:dmesg

2. 日志清理自动化

1
2
sudo journalctl --vacuum-time=7d
sudo journalctl --disk-usage

设置 logrotate

1
sudo vim /etc/logrotate.d/custom

示例:

1
2
3
4
5
6
7
8
/var/log/myapp/*.log {
daily
rotate 14
compress
missingok
notifempty
create 0640 root adm
}

八、计划任务与自动化维护

1. 使用 cron 定时任务

编辑:

1
sudo crontab -e

示例任务:

1
2
0 2 * * * apt update && apt -y upgrade
0 3 * * 0 reboot

查看任务:

1
sudo crontab -l

九、系统备份与恢复

1. rsync 远程备份

1
rsync -avz /etc /var/www admin@backup-server:/backup/ubuntu01/

2. 快照式备份(推荐 LVM/ZFS)

创建 LVM 快照:

1
lvcreate --size 2G --snapshot --name snap_root /dev/ubuntu-vg/root

恢复:

1
lvconvert --merge /dev/ubuntu-vg/snap_root

十、容器化与服务管理基础

1. 安装 Docker

1
2
3
4
5
6
7
8
9
10
11
sudo apt install ca-certificates curl gnupg -y
sudo install -m 0755 -d /etc/apt/keyrings
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | \
sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg
echo \
"deb [arch=$(dpkg --print-architecture) \
signed-by=/etc/apt/keyrings/docker.gpg] \
https://download.docker.com/linux/ubuntu jammy stable" | \
sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
sudo apt update
sudo apt install docker-ce docker-ce-cli containerd.io docker-compose -y

验证:

1
sudo docker run hello-world

十一、系统优化建议

优化方向 推荐操作
文件描述符 ulimit -n 65535 并写入 /etc/security/limits.conf
开机加速 禁用无用服务 systemctl disable bluetooth
swap 优化 减少 swap 使用率 vm.swappiness=10
SSH 登录速度 禁用反向 DNS 查询 UseDNS no
定期清理 apt autoremove && apt clean

十二、总结

通过本教程,你可以:

  • 快速搭建一台安全、稳定、自动化的 Ubuntu 22.04 运维系统;
  • 掌握 SSH、公钥认证、防火墙、安全加固的完整流程;
  • 熟悉系统性能与日志管理;
  • 学会使用 cronrsynclogrotateufw 等核心运维工具。

🚀 随着运维自动化与容器化的发展,建议进一步学习:

  • Ansible 自动化管理
  • Prometheus + Grafana 监控体系
  • Kubernetes 集群部署与维护