100个Linux运维知识点,懂一半绝对高手!
2025-05-22 13:11:54
RAIZ
一、系统基础管理
1. 系统版本查看
使用cat /etc/os-release或lsb_release -a获取发行版信息,uname -a查看内核版本及架构(CentOS/Ubuntu通用)。2. 硬件资源监控 lscpu显示CPU架构,free -h查看内存使用率,iostat -xmt 1实时监控磁盘IO性能。3. 进程管理 ps auxf查看进程树结构,kill -9强制终止异常进程,nice/renice动态调整优先级。4. 用户与权限管理 useradd -m创建带家目录用户,visudo配置sudo权限,chmod 2770设置SGID目录继承权限。5. 文件系统修复 fsck修复ext4分区,xfs_repair处理XFS损坏,debugfs恢复误删文件。6. 启动流程优化
修改/etc/default/grub调整启动参数,systemd-analyze blame分析启动耗时服务。7. 日志轮转配置 logrotate -f强制执行日志切割,journalctl -u service过滤特定服务日志。8. 软件包管理
RPM体系下rpm -V校验软件完整性,APT体系下apt-cache policy解析依赖冲突。9. 定时任务配置 crontab -e编辑周期任务,at执行单次任务,/var/log/cron审计执行记录。10. 环境变量管理 export PATH=$PATH:/new_path临时添加路径,/etc/profile全局永久配置。
二、网络与安全
11. 网络接口配置 nmcli con add创建网络连接,ip addr add临时配置IP,ethtool查看网卡物理状态。12. 防火墙规则管理 iptables -A INPUT -p tcp --dport 22 -j ACCEPT放行端口,nft list ruleset查看nftables规则。13. VPN隧道搭建
OpenVPN配置client-to-client实现点对点通信,wg-quick快速部署WireGuard隧道。14. 入侵检测防御
部署OSSEC监控文件变更,fail2ban自动封禁异常IP,auditd记录敏感操作日志。15. SSL证书管理 openssl req -newkey rsa:2048生成CSR,certbot --nginx自动续签Let's Encrypt证书。16. 网络抓包分析 tcpdump -ni eth0 'tcp port 80'过滤HTTP流量,Wireshark图形化解析数据包。17. DNS解析优化 dig +trace追踪域名解析路径,nslookup验证DNS记录,/etc/resolv.conf配置DNS服务器。18. 负载均衡实现
Nginx反向代理upstream模块,HAProxy ACL规则实现动态路由。19. 安全漏洞扫描 lynis执行CIS基准检测,nmap扫描开放端口,OpenVAS进行漏洞评估。20. SSH安全加固
禁用root登录,启用密钥认证,修改默认端口,配置Fail2Ban防爆破。
三、存储管理
21. LVM逻辑卷操作 pvcreate/vgcreate/lvcreate创建存储池,lvresize -r +10G在线扩容文件系统。22. RAID阵列维护 mdadm --create创建RAID1阵列,watch -n1 cat /proc/mdstat监控同步进度。23. 分布式存储部署
Ceph集群使用ceph-deploy工具链部署,GlusterFS创建分布式卷。24. 数据备份策略 rsync --delete镜像同步,borg create加密去重备份,xtrabackup热备MySQL。25. 磁盘性能调优 deadline调度算法优化机械盘,noop适配SSD,fio测试IOPS性能。26. 文件权限控制 setfacl -m设置ACL扩展权限,chattr +i防篡改保护,umask 0027默认权限掩码。27. 挂载点管理 /etc/fstab配置自动挂载,mount -o remount,rw修复只读文件系统。28. iSCSI配置 targetcli创建iSCSI Target,iscsiadm客户端连接,多路径冗余配置。29. 存储空间清理 ncdu可视化分析磁盘占用,find / -size +100M定位大文件。30. NFS共享配置 /etc/exports定义共享目录,showmount -e查看共享列表,Kerberos身份验证。
四、自动化与DevOps
31. Shell脚本规范 set -euxo pipefail强制严格模式,trap 'cleanup' EXIT信号捕获,mktemp创建临时文件。32. Ansible自动化部署
Playbook编写tasks/handlers模块,ansible-vault加密敏感数据,动态Inventory对接CMDB912。33. CI/CD流水线构建
Jenkins Pipeline多阶段并行构建,GitLab Runner自动触发Kubernetes部署。34. 容器化运维
Dockerfile多阶段构建减少镜像体积,kubectl rollout restart滚动更新。35. 监控告警体系
Prometheus+Alertmanager分级告警,Grafana动态仪表盘,ELK日志告警联动。36. 配置版本控制
Git管理/etc目录变更,etckeeper自动提交系统配置。37. 云平台集成
AWS CLI管理EC2实例,Terraform基础设施即代码,Ansible动态Inventory。38. API自动化测试 curl测试REST接口,jq解析JSON响应,Postman自动化测试套件。39. 日志分析平台
ELK Stack收集分析日志,Graylog统一日志管理,Loki轻量级日志聚合。40. Serverless运维
AWS Lambda函数部署,Knative配置自动扩缩容,冷启动优化策略。
五、故障诊断与优化
41. CPU性能分析 perf top定位热点函数,sar -u查看历史利用率,taskset绑定CPU核心。42. 内存泄漏排查 valgrind --leak-check=full检测应用泄漏,smem -t统计进程PSS内存。43. 磁盘I/O瓶颈 iostat -xmt 1监控读写延迟,blktrace分析块设备队列,ionice调整IO优先级。44. 网络延迟优化 tc qdisc配置流量整形,ping -M do测试MTU,ss -ti查看TCP拥塞窗口。45. 数据库调优
MySQLEXPLAIN分析慢查询,RedisMEMORY STATS监控内存使用。46. 内核参数调整 sysctl -w vm.swappiness=10减少换页,fs.file-max=65535突破文件句柄限制。47. 容器网络诊断 kubectl describe pod查看网络策略,calicoctl检查CNI配置。48. 服务雪崩防护
Hystrix熔断配置,Sentinel流量控制,服务降级策略设计。49. 内核崩溃分析 coredumpctl调试崩溃进程,kdump生成崩溃转储,crash解析vmcore。50. 云资源优化
AWS Cost Explorer分析费用,Azure Advisor优化建议,GCP资源标签分类。
六、高级运维技术
51. 内核源码编译 make menuconfig定制内核功能,dkms动态加载驱动模块。52. 虚拟化技术
KVM嵌套虚拟化配置,Libvirt管理多Hypervisor,QEMU热迁移实现零中断。53. 安全审计合规
Lynis执行CIS基准扫描,auditd规则满足GDPR要求。54. 后量子加密
OpenSSL集成后量子算法,Nginx配置混合密钥交换。55. AI辅助运维
Ansible Lightspeed生成Playbook,Prometheus AI异常检测。56. 服务网格技术
Istio配置mTLS加密,Envoy流量镜像,Linkerd服务治理。57. 无服务器架构
Knative Serving自动扩缩容,AWS Lambda冷启动优化。58. 边缘计算运维
K3s轻量级Kubernetes部署,边缘节点监控与灾备。59. 数据库高可用
MySQL MHA故障切换,Redis Cluster分片管理。60. 混沌工程实践
Chaos Monkey模拟故障,Litmus测试系统容错性。61. 区块链节点运维
Hyperledger Fabric CA管理,Geth客户端监控。62. 大数据平台维护
Hadoop集群调优,Spark资源分配策略。63. AI模型部署
TensorFlow Serving模型服务化,KFServing多框架支持。64. 物联网设备管理
MQTT Broker安全配置,EdgeX Foundry设备接入。65. 多云管理
Terraform跨云编排,Karmada多云Kubernetes联邦。66. 零信任架构
SPIFFE身份认证,OpenZiti实现微隔离。67. 绿色计算优化
CPU功耗动态调节,闲置资源自动回收。68. 数据隐私保护
GDPR合规日志脱敏,Vault管理密钥生命周期。69. 运维知识图谱
Neo4j构建拓扑关系,AI生成故障处理预案。70. 数字孪生运维
物理系统与虚拟镜像同步,预测性维护模型训练。
七、云原生技术
71. Kubernetes核心概念
Pod/Deployment/Service定义,ConfigMap管理配置。72. Helm包管理
Chart模板开发,依赖版本控制。73. Operator开发
CRD自定义资源,控制器逻辑编写。74. 服务网格
Istio流量治理,Envoy Sidecar注入。75. Serverless框架
OpenFaaS函数部署,Knative Eventing事件驱动。76. 可观测性体系
Prometheus指标采集,Jaeger分布式追踪。77. GitOps实践
ArgoCD声明式部署,FluxCD持续同步。78. 安全策略配置
OPA策略引擎,NetworkPolicy网络隔离。79. 多集群管理
Rancher联邦集群,Cluster API自动化部署。80. 边缘云协同
KubeEdge设备管理,SuperEdge节点自治。
八、运维开发技能
81. Python脚本编写
使用Paramiko实现SSH自动化,Psutil监控系统资源。82. Go语言开发
编写Kubernetes Operator,Cobra CLI工具开发。83. REST API开发
Flask/Django构建运维管理平台,Swagger文档生成。84. 数据库编程
SQLAlchemy ORM操作,Redis Pipeline批量处理。85. 自动化测试框架
Pytest单元测试,Robot Framework流程自动化。
九、职业发展能力
86. 故障复盘报告
撰写Post-Mortem文档,制定改进措施。87. 技术文档编写
Markdown编写操作手册,GitBook知识库管理。88. 跨团队协作
与开发、测试部门沟通SLA,参与敏捷迭代。89. 成本优化能力
云资源利用率分析,预留实例采购策略。90. 技术趋势洞察
跟踪CNCF技术演进,参与开源社区贡献。
十、综合实战场景
91. 全链路压测
模拟高并发流量,验证系统弹性。92. 灾备切换演练
主备数据中心切换,RTO/RPO达标验证。93. 安全攻防演练
红蓝对抗测试,修复渗透暴露点。94. 版本灰度发布
A/B测试流量分发,金丝雀发布策略。95. 容量规划评估
预测业务增长趋势,扩容缩容决策。96. 合规审计支持
准备等保测评材料,配合监管检查。97. 跨国网络优化
SD-WAN配置,全球加速方案实施。98. 遗留系统迁移
传统架构向云原生平滑过渡。99. 开源组件维护
版本漏洞修复,社区补丁Backport。100. 运维团队建设
制定On-Call轮值制度,搭建知识共享体系。