文章

CI/CD

这个分类没有描述

查看所有
    该分类下没有文章

DevOps

这个分类没有描述

查看所有
    该分类下没有文章

Docker

这个分类没有描述

查看所有
  • 一、概述 在国内网络环境下,在拉取 Docker 镜像时,常面临网络延迟高、连接频繁中断以及由于匿名访问导致的限流问题,严重影响了开发与部署效率。本文将介绍一种基于开源项目 Docker-Proxy 的自建 Docker 镜像加速服务方案。通过在本地或公有云环境部署反向代理服务,可以有效加速/优化镜像拉取,实现 Docker Hub、GHCR、GCR、Quay 等主流镜像仓库的…
    1 评论:0 时间:
  • 1、Containerd安装 先安装yum-utils工具 yum install -y yum-utils 配置Docker官方的yum仓库,如果做过,可以跳过 yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo 安装containerd yum insta…
    7 评论:0 时间:
  • 1、Docker安装 在Rocky8上,可以先配置对应版本的yum仓库,然后使用yum工具安装Docker 1)先安装yum-utils工具 yum install -y yum-utils 2)配置Docker官方的yum仓库 yum-config-manager --add-repo https://download.docker.com/linux/centos/dock…
    3 评论:0 时间:

Kubernetes

这个分类没有描述

查看所有
  • 本文记录一次 基于 kubeadm 的 Kubernetes 1.34 高可用集群 的完整落地过程,网络插件采用 Cilium(kube-proxy-free),控制平面高可用由 kube-vip 提供虚拟 IP(VIP)。 适用场景: 裸机 / 虚拟机环境 无云厂商 LB 追求 eBPF + 原生路由的高性能网络 一、环境介绍 主机名IP安装组件k8s0110.0.3.11etcd、apiser…
    14 评论:0 时间:
  • 本文记录一次 基于 kubeadm 的 Kubernetes 1.34 高可用集群 的完整落地过程,网络插件采用 Cilium(kube-proxy-free),控制平面高可用由 kube-vip 提供虚拟 IP(VIP)。 适用场景: 裸机 / 虚拟机环境 无云厂商 LB 追求 eBPF + 原生路由的高性能网络 一、环境介绍 主机名IP安装组件k8s0110.0.3.11etcd、apiser…
    41 评论:0 时间:
  • 关键词:MetalLB、L2、ARP、IPVS、Calico、kube-proxy、rp_filter、arp_ignore 适用环境:裸金属 / 虚拟机 Kubernetes 集群,无云厂商 LB 一、问题现象 在 Kubernetes 集群中部署 MetalLB(L2 模式),为 nginx-ingress 创建 Service type=LoadBalancer: Service 已正常分配…
    15 评论:0 时间:

Linux / 系统

这个分类没有描述

查看所有
    该分类下没有文章

SRE

这个分类没有描述

查看所有
  • 如果你已经在用 Prometheus + Grafana 做监控,日志方案大概率是 Promtail + Loki。但现在有个绕不开的问题:Grafana 官方已经将 Promtail 标记为废弃(deprecated),推荐迁移到 Grafana Alloy。也就是说 Promtail 不会再有新功能,未来安全补丁也不确定能维护多久。 既然 Agent 端要动,不如顺便重新审视整个日志栈。Lok…
    4 评论:0 时间:
  • 在传统的运维架构中,监控、日志与可视化往往处于割裂状态:Prometheus 承载着数值型事实,Loki 负责存储文本型证据,而 Grafana 仅承担展示工作。最终,理解数据、判断故障及做出决策的重任依然完全依赖人工。本文将探讨如何利用 Dify 结合 Grafana MCP,引入大语言模型(LLM)作为系统的“理解层”,打通数据与决策的壁垒,实现自动化的智能巡检与日志关联分析。 1. 背景与架…
    137 评论:0 时间:
  • 将多台云主机的日志集中管理,资源占用低,部署简单 为什么需要日志系统? 当你有多台云服务器时,分散的日志让排查问题变得困难: SSH 每台服务器查看日志效率低下 日志分散无法进行统一分析 日志丢失没有历史记录可查 本文介绍一套基于 Loki + Promtail 的轻量级日志集中方案: 超低资源占用:Agent 仅需 10-30MB 内存 部署简单:二进制文件,无需复杂依赖 完美集成 Grafan…
    0 评论:0 时间:

云原生存储

这个分类没有描述

查看所有
    该分类下没有文章

云计算 & 云原生

这个分类没有描述

查看所有
  • 本文记录一次 基于 kubeadm 的 Kubernetes 1.34 高可用集群 的完整落地过程,网络插件采用 Cilium(kube-proxy-free),控制平面高可用由 kube-vip 提供虚拟 IP(VIP)。 适用场景: 裸机 / 虚拟机环境 无云厂商 LB 追求 eBPF + 原生路由的高性能网络 一、环境介绍 主机名IP安装组件k8s0110.0.3.11etcd、apiser…
    14 评论:0 时间:
  • 一、概述 在国内网络环境下,在拉取 Docker 镜像时,常面临网络延迟高、连接频繁中断以及由于匿名访问导致的限流问题,严重影响了开发与部署效率。本文将介绍一种基于开源项目 Docker-Proxy 的自建 Docker 镜像加速服务方案。通过在本地或公有云环境部署反向代理服务,可以有效加速/优化镜像拉取,实现 Docker Hub、GHCR、GCR、Quay 等主流镜像仓库的…
    1 评论:0 时间:
  • 本文记录一次 基于 kubeadm 的 Kubernetes 1.34 高可用集群 的完整落地过程,网络插件采用 Cilium(kube-proxy-free),控制平面高可用由 kube-vip 提供虚拟 IP(VIP)。 适用场景: 裸机 / 虚拟机环境 无云厂商 LB 追求 eBPF + 原生路由的高性能网络 一、环境介绍 主机名IP安装组件k8s0110.0.3.11etcd、apiser…
    41 评论:0 时间:

可观测性

这个分类没有描述

查看所有
  • 如果你已经在用 Prometheus + Grafana 做监控,日志方案大概率是 Promtail + Loki。但现在有个绕不开的问题:Grafana 官方已经将 Promtail 标记为废弃(deprecated),推荐迁移到 Grafana Alloy。也就是说 Promtail 不会再有新功能,未来安全补丁也不确定能维护多久。 既然 Agent 端要动,不如顺便重新审视整个日志栈。Lok…
    4 评论:0 时间:
  • 在传统的运维架构中,监控、日志与可视化往往处于割裂状态:Prometheus 承载着数值型事实,Loki 负责存储文本型证据,而 Grafana 仅承担展示工作。最终,理解数据、判断故障及做出决策的重任依然完全依赖人工。本文将探讨如何利用 Dify 结合 Grafana MCP,引入大语言模型(LLM)作为系统的“理解层”,打通数据与决策的壁垒,实现自动化的智能巡检与日志关联分析。 1. 背景与架…
    137 评论:0 时间:

容灾与备份

这个分类没有描述

查看所有
    该分类下没有文章

性能分析

这个分类没有描述

查看所有
    该分类下没有文章

性能架构

这个分类没有描述

查看所有
    该分类下没有文章

故障复盘

这个分类没有描述

查看所有
    该分类下没有文章

架构与稳定性

这个分类没有描述

查看所有
    该分类下没有文章

生产环境规范

这个分类没有描述

查看所有
    该分类下没有文章

系统调优

这个分类没有描述

查看所有
    该分类下没有文章

网络与安全

这个分类没有描述

查看所有
    该分类下没有文章

运维基础

这个分类没有描述

查看所有
    该分类下没有文章

高可用架构

这个分类没有描述

查看所有
    该分类下没有文章

Ansible

这个分类没有描述

查看所有
  • Playbook简介 Playbooks与Ad-Hoc相比,是一种完全不同的运用Ansible的方式,而且是非常之强大的;也是系统ansible命令的集合,其利用yaml语法编写,运行过程,ansbile-playbook命令根据自上而下的顺序依次执行任务。playbook 由一个或多个 ‘plays’ 组成.它的内容是一个以 ‘plays’为元素的列表,在 play 之中,一组机器被映射为定义好…
    19 评论:0 时间:
  • 前言 Ansible是一个开源的自动化运维工具,它可以帮助管理员自动化部署、配置和管理服务器。在这篇文章中,我们将介绍如何配置Ansible的配置文件。此外,我们还将介绍Ansible的一些常用模块,如copy、raw、yum等,以及如何使用Ansible Playbook编写自动化脚本。 安装Ansible $ yum install epel-release ansible -y Ansibl…
    9 评论:0 时间:
  • 简介 Ansible 是一个 IT 自动化工具。它能配置系统、部署软件、编排更复杂的 IT 任务,如连续部署或零停机时间滚动更新。 Ansible 用 python 编写,尽管市面上已经有很多可供选择的配置管理解决方案(例如 Salt,Puppet,Chef等),但它们各有优劣。 Ansible的特点在于它的简洁。让 Ansible 在主流的配置管理系统中与众不同的一点便是,它并不需要你在想要配置…
    13 评论:0 时间:

Ceph

这个分类没有描述

查看所有
  • 1、前言与架构概述:为什么在 K8s 中选择 Rook-Ceph 在 Kubernetes 环境中,存储一直是架构设计的核心环节。Rook 作为一款云原生的自管理分布式存储编排系统,能够为 K8s 提供极为便利的存储解决方案。 Rook 的核心定位在于它本身不提供存储,而是充当 Kubernetes 与存储系统(如 Ceph)之间的适配层。它将存储软件转变为可管理的 Kubernetes 服务,从…
    5 评论:0 时间:
  • 1、前言 Rook https://rook.io 是一个自管理的 分布式存储 编排系统,可以为Kubernetes提供便利的存储解决方案。 Rook本身并不提供存储,而是在kubernetes和存储系统之间提供适配层,简化存储系统的部署与维护工作。 目前,Rook支持的存储系统包括:Ceph、CockroachDB、Cassandra、EdgeFS、 Minio、NFS。当然,Rook支持的最好…
    7 评论:0 时间:
  • 1、准备工作 机器编号主机名IP1ceph0110.0.1.2112ceph0210.0.1.2123ceph0310.0.1.213 关闭selinux、firewalld,配置hostname以及/etc/hosts $ systemctl stop firewalld $ systemctl disable firewalld $ setenforce 0 $ sed -i 's#…
    1 评论:0 时间:

DNS

这个分类没有描述

查看所有
    该分类下没有文章

EFKStack

这个分类没有描述

查看所有
  • 1、数据背景 在海量数据场景下,日志管理和分析是一项重要任务。为了解决这个问题,EFK 架构(Elasticsearch + Fluentd + Kibana)已经成为流行的选择。 然而,随着数据规模的增加,传统的 EFK 架构可能面临性能瓶颈和可用性挑战。为了提升架构的性能和可伸缩性,我们可以结合 Kafka 和 Logstash 对 EFK 架构进行优化升级。 首先,引入 Kafka 作为高吞…
    3 评论:0 时间:
  • 1、前言 Kubernetes 中比较流行的日志收集解决方案是 Elasticsearch、Fluentd 和 Kibana(EFK)技术栈,也是官方现在比较推荐的一种方案。 1、主要组件功能 Elasticsearch(ES): 强大的搜索和查询能力:ES是一个分布式搜索和分析引擎,具有高效的搜索和查询功能。它可以处理大规模的数据,并且支持复杂的查询操作。 可伸缩性和高可用性:可通过增加节点来扩…
    7 评论:0 时间:

Istio

这个分类没有描述

查看所有
  • 1、Gateway网关 Istio中的Gateway是一个用于将外部流量引入Istio服务网格的组件。它提供了入出口流量管理的功能,充当了服务网格中的边界和负载均衡器。Gateway可以让在服务网格外部的流量可以通过统一的入口接入到服务网格中的服务。 以下是一些与Istio Gateway相关的特性和概念: 1. 边界流量:Istio Gateway负责接收来自外部的流量,并将其传递到服务网格中的…
    0 评论:0 时间:
  • 1、前言 在本章节中,我们将学习一些监控(Prometheus)、追踪(Zipkin)、数据可视化工具(Grafana)和服务拓扑结构(Kiali)。(我们又学到了一款Zipkin的链路追踪组件,为什么没有用Skywalking呢?主要还是Istio原生未做支持) 为了让 Grafana 和 Kiali 工作,我们首先要安装 Prometheus 插件。 安装Prometheus, Grafana…
    1 评论:0 时间:
  • 1、Istio简介 要想搞清楚Istio是什么,还需要先知道Service Mesh是什么。 1.1 什么是Service Mesh 中文名:服务网格,是一种用于管理和协调服务之间通信的基础设施层。在现代的分布式应用程序中,由于服务的数量庞大且相互之间的依赖关系复杂,管理服务之间的通信和网络流量成为一项具有挑战性的任务。服务网格通过在应用程序的网络层引入一个透明的代理层来解决这个问题。 服务网格通…
    1 评论:0 时间:

Jenkins

这个分类没有描述

查看所有
  • 作为一种流行的持续集成和交付工具,Jenkins有多种方式来实现交付流水线。其中, Jenkins Pipeline是一种比较流行的方式,它提供了一个DSL(Domain Specific Language 的缩写,中文翻译为: 领域特定语言)来描述交付流水线。 官方:Pipeline Syntax (jenkins.io) 1、什么是Jenkins Pipeline Jenkins Pipeli…
    0 评论:0 时间:
  • 相对于基于控制器文件部署的方式有哪些优点: 利于形成DEVOPS标准化; 控制器方式需要维护大量的yaml文件; 相对于helm方式,控制器方式低效且不够灵活; 当前环境环境基于控制器文件部署: //定义git相关数据 def git_address = "http://gitlab.kubernets.cn/demoteam/java_kubernetes.git" def …
    0 评论:0 时间:
  • 环境说明k8s集群内部部署了一套jenkins master,命名空间为devops;随后在集群外部通过docker部署一套jenkins master,两套jenkins master版本一致。通过ingress将k8s api接口暴露,配置DNS解析指向LoadBalancer IP 在集群外部的jenkins上添加kubernetes凭证及集群,添加集群时指定命名空间为devops;运行jo…
    1 评论:0 时间:

Linux

这个分类没有描述

查看所有
  • 一、概述 在国内网络环境下,在拉取 Docker 镜像时,常面临网络延迟高、连接频繁中断以及由于匿名访问导致的限流问题,严重影响了开发与部署效率。本文将介绍一种基于开源项目 Docker-Proxy 的自建 Docker 镜像加速服务方案。通过在本地或公有云环境部署反向代理服务,可以有效加速/优化镜像拉取,实现 Docker Hub、GHCR、GCR、Quay 等主流镜像仓库的…
    1 评论:0 时间:
  • 引言:ossfs工具简介与部署价值 ossfs是一款开源的FUSE(Filesystem in Userspace)工具,能够将阿里云对象存储服务(OSS)的存储空间(Bucket)挂载到Linux本地文件系统中,使用户能够像操作本地文件一样管理云端数据。对于IT工程师和运维人员而言,ossfs提供了一种便捷的数据访问方式,特别适用于需要频繁访问OSS存储内容的应用场景。 本文将为Linux系统管…
    24.5k 评论:0 时间:
  • 1、克隆代码到本地 git clone https://gitlab.zhoumx.net/root/gitlab-webhook-dingrobot.git 配置钉钉webhook cd ./gitlab-webhook-dingrobot/src/main/resources vim application.yml server: port: 8787 webhook: enable-emoj…
    15 评论:0 时间:

Linux 内核

这个分类没有描述

查看所有
    该分类下没有文章

Ops工具

这个分类没有描述

查看所有
  • 引言:ossfs工具简介与部署价值 ossfs是一款开源的FUSE(Filesystem in Userspace)工具,能够将阿里云对象存储服务(OSS)的存储空间(Bucket)挂载到Linux本地文件系统中,使用户能够像操作本地文件一样管理云端数据。对于IT工程师和运维人员而言,ossfs提供了一种便捷的数据访问方式,特别适用于需要频繁访问OSS存储内容的应用场景。 本文将为Linux系统管…
    24.5k 评论:0 时间:
  • 1、克隆代码到本地 git clone https://gitlab.zhoumx.net/root/gitlab-webhook-dingrobot.git 配置钉钉webhook cd ./gitlab-webhook-dingrobot/src/main/resources vim application.yml server: port: 8787 webhook: enable-emoj…
    15 评论:0 时间:
  • 在ARM服务器上,运行vdbench出现共享库不匹配的解决方法 # 报错如下: [root@axing vdbench50407]# ./vdbench -t Copyright (c) 2000, 2018, Oracle and/or its affiliates. All rights reserved. Vdbench distribution: vdbench50407 Tue…
    1 评论:0 时间:

Prometeheus

这个分类没有描述

查看所有
  • 在现代云原生环境中,Kubernetes监控已成为保障系统稳定性的核心环节。Prometheus作为CNCF毕业项目,凭借其强大的数据模型和查询语言,在容器监控领域占据主导地位。本文将深入解析Prometheus Operator、Kube-Prometheus和Helm Chart三种部署方式的技术特点与适用场景,为IT工程师和运维团队提供完整的部署指导。 Kubernetes监控方案选型:Pr…
    129 评论:0 时间:

Service Mesh

这个分类没有描述

查看所有
    该分类下没有文章

SkyWalking

这个分类没有描述

查看所有
  • 在微服务架构日益普及的今天,全链路监控已成为保障系统稳定性的关键组件。Apache SkyWalking 作为一款优秀的应用性能监控(APM)工具,提供了灵活的 Agent 接入方式。本文将详细阐述如何在 Kubernetes 环境下,通过 Sidecar 模式部署 SkyWalking Agent,并针对 Spring Boot 微服务进行实战配置。 一、SkyWalking Agent在K8s…
    1 评论:0 时间:
  • 官方文档:apache/skywalking-kubernetes: Apache SkyWalking Kubernetes Deployment Helm Chart (github.com) 1、认识skywalking组件 Skywalking OAP Server: Skywalking OAP Server 是 Skywalking 分析系统的核心组件之一。 主要负责接收和处理来自 S…
    3 评论:0 时间:
  • 1、Skywalking介绍 1.1 APM APM (Application Performance Management )应用性能管理 ,通过各种探针采集并上报数据,收集关键指标,同时搭配数据展示以实现对应用程序性能管理和故障管理的系统化解决方案。 目前主要的一些 APM 工具有: Cat、Zipkin、Pinpoint、SkyWalking,这里主要介绍 SkyWalking ,它是一款优…
    5 评论:0 时间:

Zabbix

这个分类没有描述

查看所有
  • 什么是Zabbix监控系统 Zabbix是一款高度可扩展的开源监控和告警解决方案,专为IT基础设施监控而设计。作为企业级监控平台,Zabbix能够对网络设备、服务器、应用程序等进行全方位监控,确保系统稳定运行。 Zabbix核心组件架构 Zabbix监控系统采用分布式架构设计,主要包含以下核心组件: Zabbix Server Zabbix Server是整个监控系统的核心引擎,负责数据采集、处理…
    1k 评论:0 时间:

云原生

这个分类没有描述

查看所有
  • 1、前言与架构概述:为什么在 K8s 中选择 Rook-Ceph 在 Kubernetes 环境中,存储一直是架构设计的核心环节。Rook 作为一款云原生的自管理分布式存储编排系统,能够为 K8s 提供极为便利的存储解决方案。 Rook 的核心定位在于它本身不提供存储,而是充当 Kubernetes 与存储系统(如 Ceph)之间的适配层。它将存储软件转变为可管理的 Kubernetes 服务,从…
    5 评论:0 时间:
  • 本文记录一次 基于 kubeadm 的 Kubernetes 1.34 高可用集群 的完整落地过程,网络插件采用 Cilium(kube-proxy-free),控制平面高可用由 kube-vip 提供虚拟 IP(VIP)。 适用场景: 裸机 / 虚拟机环境 无云厂商 LB 追求 eBPF + 原生路由的高性能网络 一、环境介绍 主机名IP安装组件k8s0110.0.3.11etcd、apiser…
    41 评论:0 时间:
  • 关键词:MetalLB、L2、ARP、IPVS、Calico、kube-proxy、rp_filter、arp_ignore 适用环境:裸金属 / 虚拟机 Kubernetes 集群,无云厂商 LB 一、问题现象 在 Kubernetes 集群中部署 MetalLB(L2 模式),为 nginx-ingress 创建 Service type=LoadBalancer: Service 已正常分配…
    15 评论:0 时间:

生产事故

这个分类没有描述

查看所有
    该分类下没有文章

监控

这个分类没有描述

查看所有
  • 如果你已经在用 Prometheus + Grafana 做监控,日志方案大概率是 Promtail + Loki。但现在有个绕不开的问题:Grafana 官方已经将 Promtail 标记为废弃(deprecated),推荐迁移到 Grafana Alloy。也就是说 Promtail 不会再有新功能,未来安全补丁也不确定能维护多久。 既然 Agent 端要动,不如顺便重新审视整个日志栈。Lok…
    4 评论:0 时间:
  • 在传统的运维架构中,监控、日志与可视化往往处于割裂状态:Prometheus 承载着数值型事实,Loki 负责存储文本型证据,而 Grafana 仅承担展示工作。最终,理解数据、判断故障及做出决策的重任依然完全依赖人工。本文将探讨如何利用 Dify 结合 Grafana MCP,引入大语言模型(LLM)作为系统的“理解层”,打通数据与决策的壁垒,实现自动化的智能巡检与日志关联分析。 1. 背景与架…
    137 评论:0 时间:
  • 将多台云主机的日志集中管理,资源占用低,部署简单 为什么需要日志系统? 当你有多台云服务器时,分散的日志让排查问题变得困难: SSH 每台服务器查看日志效率低下 日志分散无法进行统一分析 日志丢失没有历史记录可查 本文介绍一套基于 Loki + Promtail 的轻量级日志集中方案: 超低资源占用:Agent 仅需 10-30MB 内存 部署简单:二进制文件,无需复杂依赖 完美集成 Grafan…
    0 评论:0 时间:

负载均衡

这个分类没有描述

查看所有
    该分类下没有文章

运维入门

这个分类没有描述

查看所有
    该分类下没有文章

进程与资源管理

这个分类没有描述

查看所有
    该分类下没有文章

防火墙 / WAF

这个分类没有描述

查看所有
    该分类下没有文章

零信任

这个分类没有描述

查看所有
    该分类下没有文章
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索