Seamon

cloudsre

Beijing, China
  • Home
  • Archives
  • Categories
  • Tags
  • About

公告

持续学习~

分类

  • bugs9
  • k8s6
  • log1
  • servicemesh1
  • sre5
  • 优化2
  • 基础1
  • 源码5

标签

  • bugs8
  • chatops1
  • client-go3
  • controller1
  • ddos1
  • dev4
  • devops1
  • event3
  • freetalk3
  • glusterfs2
  • healthcheck3
  • informer3
  • ingress3
  • istio1
  • k8s17
  • k8swatch1
  • keepalive1
  • kube-proxy1
  • kubeadm2
  • kubelet3
  • kubernetes2
  • log1
  • monitor1
  • nginx1
  • node1
  • performance1
  • service-mesh1
  • sre9
  • story2
  • upgrade1
  • 源码3

最新文章

  • client-go的informer的工作流程

    2020-03-08

  • client-go中的Indexer

    2020-03-07

  • 二叉树的右视图

    2020-02-16

  • DDOS三连击

    2020-02-15

  • SRE成长的故事

    2020-02-12

发送告警实践

情境 组里同事开发了alert-speaker作为webhook给alertmanager调用,解决报警接收人的问题。 k8s的事件告警、日志告

  2019-12-16   sre   sre dev monitor  评论 字数统计: 552字 阅读时长: 2分

k8s的nodePort在物理机上不工作

有天,领导告知IAAS组新有一批空闲的物理机可以给我们用,希望扩容到k8s集群中,提升性能并降低云主机的成本,于是在IAAS组将系统重做之后

  2019-12-05   bugs   k8s kube-proxy bugs  评论 字数统计: 468字 阅读时长: 1分

异常事件-k8s节点频繁NotReady

不时的收到个别k8s节点node notready的告警,大概如下: Component:kubelet Count:1 CreatedTimestamp:2019-11-06 16:42:51 Subject:Node节点不可用-default/nodenam

  2019-11-25   bugs   k8s event kubelet  评论 字数统计: 1407字 阅读时长: 3分

稳定性保障所需的一些措施

要严格保证SLA,SLR,很多人会拆解为降低MTTD,MTTR,网上关于他们的定义很多,比如: Mean Time To Detect(MTTD)=(故障得到定位

  2019-11-25   sre  评论 字数统计: 755字 阅读时长: 2分

kubelet对应用healthCheck接口的重定向处理

下午,收到一条异常事件的告警,Reason是ProbWarning,之前没见过。 下午给新版本的k8s(1.14)添加了事件监控,没一会便收到

  2019-11-21   bugs   kubelet healthCheck k8s bugs  评论 字数统计: 1269字 阅读时长: 3分

物理机的CPU freq调节

线上k8s集群有一批新上的物理机,应用调度到物理机上以为性能会更好,但却发现容器CPU使用率并不低,即便是空闲时间也会高,物理机的load也

  2019-10-25   优化   k8s performance  评论 字数统计: 1253字 阅读时长: 3分

大跨度升级ingress-nginx的版本

背景 当前ingress-nginx的版本比较旧(0.9.0)存在bug,比如:keep-alive不生效,另一方面对于用户呼声较高的新需求:

  2019-10-15   k8s 源码   bugs ingress k8s  评论 字数统计: 2360字 阅读时长: 5分

Page:2/5
©2017 - 2020
Theme by xiaoheiAh base on pure.