Xinkun Blog

科学引导思想 技术改变生活

kubernetes endpoint一会消失一会出现的问题剖析

Endpoints of kubernetes disappear for a while.

问题现象 发现某个service的后端endpoint一会显示有后端,一会显示没有。显示没有后端,意味着后端的address被判定为notready。 endpoint不正常的时候: [root@localhost /]# kubectl get ep --namespace cxqt npth-price -o yaml apiVersion: v1 kind: Endpoints...

docker启动容器报错: could not synchronise with container process: not a directory

solve could not synchronise with container process error.

错误现象 在运行容器时,出现以下错误 [root@localhost test]# docker run -it -d -v $PWD/test.txt:/mydir mytest fd44cdc550548c0b791d6a7d12d27a2d64855c7c5d498305dd1239d6608b4350 Error response from daemon: Cannot sta...

docker中执行sed: can't move '/etc/resolv.conf73UqmG' to '/etc/resolv.conf': Device or resource busy错误的处理原因及方式

Solve sed error in docker.

错误现象 在docker容器中想要修改/etc/resolv.conf中的namesever,使用sed命令进行执行时遇到错误: / # sed -i 's/192.168.1.1/192.168.1.254/g' /etc/resolv.conf sed: can't move '/etc/resolv.conf73UqmG' to '/etc/resolv.conf': Device...

docker对cpu使用及在kubernetes中的应用

The way to use cpu in docker and kubernetes.

docker对CPU的使用 docker对于CPU的可配置的主要几个参数如下: --cpu-shares CPU shares (relative weight) --cpu-period Limit CPU CFS (Completely Fair Scheduler) period --cpu-q...

使用docker部署ambari的若干要点

Using docker to deploy ambari.

ambari部署各个组件 使用ambari进行部署时主要需要的组件包括: ambari-server: 主要部署的控制节点,负责控制agent进行部署。 mysql: server存储的数据库。也支持postgresql等数据库。 ambari-agent: 主要执行部署的节点,根据控制节点,部署相应的服务的相应组件(compoment)。 repo: 可以是公网的库,...

容器化实践的经验分享

The Experience Sharing of Containerization Practice.

前言 在私有云的容器化过程中,我们并不是白手起家开始的。而是接入了公司已经运行了多年的多个系统,包括自动编译打包,自动部署,日志监控,服务治理等等系统。在容器化之前,基础设施主要以物理机和虚拟机为主。因此,我们私有云落地的主要工作是基础设施容器化,同时在应用的运维方面,兼用了之前的配套系统。利用之前的历史系统有利有弊,这些后面再谈。关于我们的私有云的一些架构技术,在我们团队过去的一些公开分...

tensorflow与kubernetes/docker结合使用实践

A practice used in combination with tensorflow and kubernetes.

tensorflow tensorflow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理。Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算,TensorFlow为张量从图象的一端流动到另一端计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统。 tensorflow可在小到一部...

etcd使用之ttl不准确问题

TTL for etcd

问题现象 部署有一个etcd集群,分别是10.8.65.106,10.8.65.107和10.8.65.108。 然后我使用etcdctl为一个值设置ttl,然后通过watch观察,发现失效时间不准确,而且时间随机。 比如我设置/mytest/test的ttl时间为10秒 [root@node-106 ~]# date && etcdctl set --ttl 10 ...

spark单机部署及样例运行

Deploy spark in local host.

spark单机运行部署 环境预装 需要预先下载jdk和spark。机器使用centos6.6(推荐)。然后依次运行 [root@spark-master root]# cd /root #安装必要的软件 [root@spark-master root]# yum install -y tar git curl wget #下载jdk [root@spark-master root]...

kubernetes源码阅读及编译

Build kubernetes from source.

kubernetes源码阅读 工欲善其事,必先利其器。在阅读kubernetes源码时,我也先后使用过多个IDE,最终还是停留在IDEA上。 我惯用的是pycharm(IDEA的python IDE版本),配上go的插件,把源码目录进行合理组织后,加入到go的lib,即可实现跳转。更多的方法可以参看这里。 kubernetes源码编译 kubernetes的源码编译可以分为两种方式。...