Skip to content

Ubuntu服务器运维

根据pid查询细节

sudo ls -lah /proc/<pid>
然后根据其中的cwd找到运行目录,exe找到运行程序

在终端向程序输入字节

# 输入raw bytes
echo -e '\x31\x32' | program

# 不带echo自动加的换行
echo -en '\x31\x32' | program

# 输入raw binary
echo -e '\x31\x32' | xxd -r -p | program 

查询服务器显卡

查询物理槽显卡连接

lspci | grep VGA

查询活跃情况(需要安装显卡驱动,可以直接安装CUDA runfile,自带驱动)

nvidia-smi

统计服务器进程占用

htop # 观察内存、各进程、CPU占用
sudo ls -lah /proc/<pid>/cwd # 观察运行的命令,判断谁的程序

统计磁盘用量

ncdu # 统计当前目录下各个文件夹占用,可以进入、删除文件夹或目录

修改DNS

有时候连不上网是因为DNS的问题,修改/etc/resolve.conf即可。不过这个软连接修改完了以后可能会被系统改掉,可以试试删掉以后直接创建个/etc/resolve.conf文件,再chattr +i /etc/resovle.conf防止修改。

系统服务

systemctl status xxx检查某些服务运行状态,可以ls -lah /etc/systemd/systemls -lah /lib/systemd/system查询有哪些服务。警惕奇怪的数字service,可能是病毒。

添加系统服务时,创建/etc/systemd/system/xxx.service文件,然后编辑内容,比如下面的socat.service:

[Unit]
Description=port forward 4320
# 启动顺序(多个服务中间用空格隔开)
After=network.target[当前服务在指定服务之后启动]
Before=[当前服务在指定服务之前启动]

# 依赖关系
Wants=[弱依赖关系服务,指定服务发生异常不影响当前服务]
Requires=[强依赖关系服务,指定服务发生异常,当前服务必须退出]

[Service]
User=nobody
ExecStart=/usr/bin/socat TCP4-LISTEN:4320,fork TCP4:10.244.55.25:80
ExecReload=[重启服务时执行的命令]
ExecStop=[停止服务时执行的命令]
ExecStartPre=[启动服务之前执行的命令]
ExecStartPost=[启动服务之后执行的命令]
ExecStopPost=[停止服务之后执行的命令]

# 启动类型
# simple(默认值):ExecStart字段启动的进程为主进程
# forking:ExecStart字段将以fork()方式启动,此时父进程将会退出,子进程将成为主进程
# oneshot:类似于simple,但只执行一次,Systemd 会等它执行完,才启动其他服务
# dbus:类似于simple,但会等待 D-Bus 信号后启动
# notify:类似于simple,启动结束后会发出通知信号,然后 Systemd 再启动其他服务
# idle:类似于simple,但是要等到其他任务都执行完,才会启动该服务。一种使用场合是为让该服务的输出,不与其他服务的输出相混合
Type=[启动类型]

# 如何停止服务
# control-group(默认值):当前控制组里面的所有子进程,都会被杀掉
# process:只杀主进程
# mixed:主进程将收到 SIGTERM 信号,子进程收到 SIGKILL 信号
# none:没有进程会被杀掉,只是执行服务的 stop 命令。
KillMode=[如何停止服务]

# 重启方式
# no(默认值):退出后不会重启
# on-success:只有正常退出时(退出状态码为0),才会重启
# on-failure:非正常退出时(退出状态码非0),包括被信号终止和超时,才会重启
# on-abnormal:只有被信号终止和超时,才会重启
# on-abort:只有在收到没有捕捉到的信号终止时,才会重启
# on-watchdog:超时退出,才会重启
# always:不管是什么退出原因,总是重启
Restart=[服务退出后,Systemd 的重启方式]

RestartSec=[表示 Systemd 重启服务之前,需要等待的秒数]

[Install]
WantedBy=multi-user.target
# 执行 sytemctl enable **.service命令时,**.service的一个符号链接,就会放在/etc/systemd/system/multi-user.target.wants子目录中
# 执行systemctl get-default命令,获取默认启动Target
# multi-user.target组中的服务都将开机启动
# 常用Target,1. multi-user.target-多用户命令行;2. graphical.target-图形界面模式
WantedBy=[表示该服务所在的Target]
  • 启动systemctl start **
  • 关闭systemctl stop **
  • 重启systemctl restart **
  • 查看运行状态systemctl status **
    • Loaded行:配置文件的位置,是否设为开机启动;
    • Active行:表示正在运行;
    • Main行:主进程PID;
    • Status行:由应用本身提供的软件当前状态;
    • CGroup行:应用的所有子进程
    • 日志块:应用的日志
  • 设置开机自启systemctl enable ** enable命令相当于在目录里添加了一个符号链接。开机时,Systemd会执行/etc/systemd/system/目录里面的配置文件
  • 结束服务进程systemctl kill **
  • 查看配置文件systemctl cat **
  • 查看multi-user.target 包含的所有服务systemctl list-dependencies multi-user.target
  • 切换到另一个 target systemctl isolate graphical.target
  • 重新加载配置文件systemctl daemon-reload

定时服务

定时程序执行失败的原因是多样的,可能是因为定时服务没启动,需要systemctl restart cron.service,或者是cron服务坏掉了,先apt install cron --reinstall强制重新安装下,再重启服务,或者是安装了别的依赖库但是没有重启cron导致运行失败,试试/etc/init.d/cron restart

打开文件数

https://www.baeldung.com/linux/list-open-file-descriptors

Linux默认最多同时打开1024个文件,可以通过ulimit -n查看。fuzzing等要注意关闭文件描述符,否则可能导致服务器故障(比如ssh连不上)。/proc//fd里列出了pid锁打开的文件。

参考资料

  1. systemd相关资料