现场实践输入
从开发、测试、生产环境的真实问题出发,处理系统部署、资源监控、基础网络、 Docker、Redis、Kafka、MySQL 等日常运维场景。
我不希望个人主页只是罗列工具,而是把自己的成长路径讲清楚: 从真实问题出发,用工程方法解决,再沉淀为可复用体系,最终向 AIOps 能力演进。
从开发、测试、生产环境的真实问题出发,处理系统部署、资源监控、基础网络、 Docker、Redis、Kafka、MySQL 等日常运维场景。
把重复操作转化为脚本、流程和流水线,通过 Shell、Ansible、Jenkins Pipeline、 Supervisor 等工具降低人工发布和回滚风险。
让系统运行状态可见、告警可达、日志可查、链路可追踪。 通过 Prometheus、Nightingale、OpenTelemetry等工具 缩短故障定位时间。
通过 Hermes、MCP Server、Prometheus、Elasticsearch等与飞书机器人联动, 让 AI 能读取真实运维数据,辅助告警分析和故障定位。
拾取每一份实践中的思考碎片,捕捉每一次沉淀后的成长灵感,用专注与坚守, 构筑属于自己的成长天地,步履不停,向阳生长,在热爱与坚守中, 沉淀出独有的价值与光芒。
按真实运维场景拆解能力,突出“能解决什么问题、如何落地、使用哪些工具”。
解决问题
保障开发、测试、生产环境稳定运行,处理服务部署、系统异常、网络接入和基础故障定位。
在公司负责开发、测试、生产三套环境基础运维,以及生产服务器资源监控、基础网络问题处理;在物联网平台中设计 DDNS 与网络黑盒监控方案,保障设备上报链路稳定。
解决问题
让业务服务从手工部署走向容器化、标准化、多节点部署,降低环境差异和上线风险。
在新能源汽车物联网综合服务平台中,完成 Java / Go 应用多节点部署、Docker 容器运维、中间件环境搭建与性能调优,推动服务从单节点向分布式集群转变。
解决问题
让系统运行状态可见、告警可达、日志可查、链路可追踪,缩短故障定位时间。
落地全链路监控体系后,故障响应时间缩短 40%;结合 EFK 日志体系,跨服务问题排查从小时级压缩至分钟级。
解决问题
保障核心中间件稳定运行,处理同步、备份、高可用、性能调优和常见故障。
搭建 Redis 哨兵集群与基于 GTID 的 MySQL 主从同步方案,编写 MySQL 自动备份、多重校验和远程备份脚本。
解决问题
减少人工发布风险,标准化构建、部署、回滚和批量任务处理流程。
构建前后端 CI/CD 流水线,基于 Jenkins Pipeline 与 Supervisor 实现微服务自动化发布;标准化发布/回滚后,部署频率提升 3 倍,回滚耗时控制在 3 分钟内。
解决问题
把监控、日志、链路、MCP 工具和智能助手串联起来,让 AI 能读取真实运维数据并辅助排障。
主导 AIOps 运维体系设计、MCP 工具设计与工具链搭建;开发 MCP Server 对接 Prometheus、Elasticsearch,使 AI 具备调用运维数据能力,并通过飞书端 AIOps 助手实现自然语言分析和故障定位。
工作和项目经历强调职责、工程落地和业务结果。
负责 Linux 平台应用部署、生产资源监控、微服务监控、Docker、Redis、Kafka、MySQL 运维及故障处理。
负责 Java / Go 应用多节点部署、Docker 容器运维、中间件搭建、Nginx 负载均衡调优和 DDNS 方案落地。
设计 MCP 工具链和 AIOps 运维助手,对接 Prometheus、Elasticsearch、Dify、Langbot、Hermes 与飞书机器人。
累计撰写技术文章 70+,内容聚焦系统运维、自动化、微服务和 AIOps 实践。
以下是作者在大学期间的一些经历与荣誉,展示个人价值与持续学习的能力。
获得优胜选手,聚焦云计算基础能力与工程实践,对云计算有了初步的概念。
完成校企联合培养,重点发展云计算运维/开发领域;获得优秀毕业生/优秀结业相关荣誉。
完成人工智能训练师方向认证,补充 AI 工具应用、数据处理和智能交互能力,悉知了人工智能的数据清洗与优化。
综合分数院系前十,专业前三,体现持续学习和综合表现,同时获得沈阳市政府奖学金。
智能家居 + AI 项目参赛,省赛阶段获得金奖。
前往江苏常州参加国内总决赛,以云原生 + AI + AIoT 项目参赛,以队长身份带领团队经历半年备战拿下最终荣誉。
这个页面只作为个人展示和入口聚合,沟通请通过以下方式。