目录
背景
最近在逐步接手公司JStorm实时计算部分的Mesos集群管理,公司的实时计算引擎目前以Alibaba JStorm为主,资源管理部分依托于Mesos+Marathon+Docker,这种部署方式在集群扩容和管理方面是非常方便的,而且通过不同角色限制可以实现多个小物理集群资源隔离。Mesos Master管理页面中,不同Frameworks代表不同的物理集群:
Marathon应用管理页面:
xfsprogs/kmod冲突
业务不断新增导致现有集群资源较为紧张需要对集群进行扩容,通过脚本自动化部署以后发现有一部分Mesos-Slave角色启动失败,登录机器后查看日志发现不同环境因版本不同会出现一些异常。(本次扩容北京机房服务器)错误信息如下:
net.ipv4.ip_local_port_range = 57345 65530 警告:rhel7u4/dracut-033-502.el7.x86_64.rpm: 头V3 RSA/SHA256 Signature, 密钥 ID fd431d51: NOKEY 准备中... ################################# [100%] 正在升级/安装... 1:dracut-033-502.el7 ################################# [ 10%] 2:dracut-network-033-502.el7 ################################# [ 20%] 3:kexec-tools-2.0.14-17.el7 ################################# [ 30%] 4:dracut-config-rescue-033-502.el7 ################################# [ 40%] 5:linux-firmware-20170606-56.gitc99################################# [ 50%] 正在清理/删除... 6:dracut-config-rescue-033-359.el7 ################################# [ 60%] 7:kexec-tools-2.0.7-38.el7 ################################# [ 70%] 8:dracut-network-033-359.el7 ################################# [ 80%] 9:linux-firmware-20150904-43.git6eb################################# [ 90%] 10:dracut-033-359.el7 ################################# [100%] 警告:kernel-3.10.0-693.1.1.el7.x86_64.rpm: 头V3 RSA/SHA256 Signature, 密钥 ID fd431d51: NOKEY 错误:依赖检测失败: xfsprogs < 4.3.0 与 kernel-3.10.0-693.1.1.el7.x86_64 冲突 kmod < 20-9 与 kernel-3.10.0-693.1.1.el7.x86_64 冲突 Removed symlink /etc/systemd/system/multi-user.target.wants/mesos-master.service. Removed symlink /etc/systemd/system/multi-user.target.wants/marathon.service.
依赖冲突问题分析
查看已经安装的模块信息,系统提示xfsprogs模块已经存在通过对比发现已经存在的版本比较低,需要手动卸载:
[mesos@host pack]$ sudo yum --showduplicates list xfsprogs kmod 已加载插件:fastestmirror, langpacks Loading mirror speeds from cached hostfile 已安装的软件包 kmod.x86_64 20-5.el7 @anaconda xfsprogs.x86_64 3.2.2-2.el7 @anaconda 可安装的软件包 kmod.x86_64 20-9.el7 base xfsprogs.x86_64 4.5.0-8.el7 base [mesos@host pack]$ sudo rpm -e kmod-20-5.el7.x86_64 --nodeps [mesos@host pack]$ sudo rpm -e xfsprogs-3.2.2-2.el7.x86_64 --nodeps
重新安装xfsprogs完成后如果没有更新kmod系统则会提示依赖检测失败:
警告:rhel7u4/dracut-033-502.el7.x86_64.rpm: 头V3 RSA/SHA256 Signature, 密钥 ID fd431d51: NOKEY 错误:依赖检测失败: kmod 被 dracut-033-502.el7.x86_64 需要 警告:kernel-3.10.0-693.1.1.el7.x86_64.rpm: 头V3 RSA/SHA256 Signature, 密钥 ID fd431d51: NOKEY 错误:依赖检测失败: module-init-tools >= 3.16-2 被 kernel-3.10.0-693.1.1.el7.x86_64 需要 [mesos@host pack]$ sudo yum install kmod
手动安装kmod模块后[kbd]systemctl status mesos-slave[/kbd]查看Mesos-Slave角色启动成功 :
参考资料
转载请注明:雪后西塘 » xfsprogs/kmod版本更新支持Mesos-Slave安装