编程开源技术交流,分享技术与知识

网站首页 > 开源技术 正文

详解蓝鲸部署常见报错及解决方案汇总

wxchong 2024-06-27 01:08:37 开源技术 11 ℃ 0 评论

概述

本篇主要介绍一下蓝鲸部署过程中的一些报错及解决方案,仅供参考。

ps:解决方法写的有点简单,部分思考过程省略了,不过按步骤是可以解决的




1、安装paas平台报错

解决:修改install.config文件格式为

17xxx xxxx服务名,xxxx服务....

或者先做好事前检查也可以。


2、安装cmdb报错

报错:mongodb start failed. check /data/bkce/logs/mongodb/mongod.log


查看/data/bkce/logs/mongodb/mongod.log日志提示:

从报错看是副本集没做初始化


初始化副本集过程:

/data/bkce/service/mongodb/bin/mongo
use admin
--初始化副本集, _id和启动时设置的replSet参数相同
rs.initiate({ _id:"rs0", members:[ {_id:0,host:"1xxx:27017"}]})
--查看副本集状态
rs.status()




3、安装bkdata报错

/usr/bin/ld: cannot find -lmysqlclient

collect2: error: ld returned 1 exit status

error: command 'gcc' failed with exit status 1


解决:lmysqlclient文件其实是 对应了 mysqlclient.so 这个文件

find / -name 'libmysqlclient.so'
ln -s /data/bkce/service/mysql/lib/libmysqlclient.so /usr/lib64/libmysqlclient.so 



4、部署bkdata卡顿

卡在run trt migration这一步

解决:

1、观察TOP cpu 10进程发现这一步很消耗资源:

2、在三处文件添加以下代码:

try:
    import pymysql
    pymysql.install_as_MySQLdb()
    print '=>use pymysql'
except ImportError:
    pass

2.1、/data/bkce/bkdata/dataapi/manage.py


2.2、/data/bkce/bkdata/dataapi/databus/db_helper.py


2.3、/data/bkce/bkdata/dataapi/pizza/settings.py


3、修改另一个文件代码:/data/bkce/bkdata/dataapi/databus/shipper.py

op_record("admin", cluster, 'delete connector %s in %s' % (conf['name'], cluster), "", del_ret)
替换为
op_record("admin", cluster, 'delete connector %s in %s' % (conf['name'], cluster), "", del_ret.text)



5、部署bkdata报错

ERROR: init_snapshot_config (databus.tests.DatabusHealthTestCase)

解决:

1、查看状态

注意这里如果都正常还起不来就按下面步骤进行,我这里是都正常的

2、修改文件:/data/bkce/bkdata/dataapi/maple/query/storage/mysql_driver.py

from MySQLdb.connections import ProgrammingError, OperationalError
改成
from _mysql_exceptions import ProgrammingError, OperationalError


3、修改文件: /data/bkce/bkdata/dataapi/pizza/settings.py

在pymysql.install_as_MySQLdb()下一行增加代码
import sys
sys.modules['_mysql_exceptions'] = sys.modules['pymysql.err']


4、启动bkdata重新安装

./bkcec start bkdata




6、bkdata部署卡顿

这里也是卡在了 run trt migration,但是解决方法是不一样的


解决:

1、查看状态

 ./bkcec status all


2、测试重启ES

3、修改/etc/profile文件的ulimit参数后重启即可


7、部署saas-o报错

ERROR  deploy failed: timeout
Deploy saas bk_monitor failed


解决:

1、查看日志/data/bkce/logs/paas_agent/agent.log

2、手动安装:

nohup ./bk_install saas-o bk_monitor >> installsaas.log &


3、继续安装:

nohup ./bk_install saas-o >> installsaas.log &


4、手动安装:

nohup ./bk_install saas-o bk_nodeman >> installsaas.log &


5、继续安装:nohup ./bk_install saas-o >> installsaas.log &



到这里大家基本都可以自己独立完成蓝鲸的部署了,后面的功能模块体验再看要不要放上来吧,主要是用蓝鲸监控这个东西我就不太想用了...感兴趣的朋友可以自己测试一下~

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表