找回密码
 新注册用户
搜索
查看: 7317|回复: 23

换了任务,问题多多

[复制链接]
发表于 2016-7-17 22:46:09 | 显示全部楼层 |阅读模式
OET眼看百年,项目进度不到50%(虽说不怎么靠谱),于是转向其它项目,MCM+UGM+HSTB,然后问题来了:
PPD减少40%(1T多啊)就不说了,先是部分CPU出现不能满载的情况,初步判断是供电或者是温度的问题,OET可能压力不够。
然后是某些任务工作不正常,已经有两台机器出现一个HSTB的僵尸进程,吃掉了90%以上的内存,重启和杀进程均不能解决,图形界面因为没内存也不能动,命令又不熟悉,只能重装系统。
不知道这是任务本身的BUG,还是我自己的问题。
回复

使用道具 举报

发表于 2016-7-17 23:30:06 来自手机 | 显示全部楼层
怎么觉得问题有点熟悉,再群里问占内存的是兄弟吗?
回复

使用道具 举报

 楼主| 发表于 2016-7-18 00:14:37 | 显示全部楼层
guihuo 发表于 2016-7-17 23:30
怎么觉得问题有点熟悉,再群里问占内存的是兄弟吗?

应该是吧
回复

使用道具 举报

发表于 2016-7-18 10:22:51 | 显示全部楼层
ps axu 查进程PID
kill -9 [PID]  强制停止并终止进程

/etc/init.d/boinc-client stop    终止boinc后台

HSTB 刚出的时候跑过一阵,感觉不是很稳定于是转回旧项目了
回复

使用道具 举报

发表于 2016-7-18 10:25:01 | 显示全部楼层
另外不熟悉boinccmd的话可以用boinctui来控制
回复

使用道具 举报

 楼主| 发表于 2016-7-18 10:54:49 | 显示全部楼层
mjy 发表于 2016-7-18 10:22
ps axu 查进程PID
kill -9   强制停止并终止进程

这些都试过,kill之后还会冒出来,boinc杀掉是没问题,但是还是不能杀包,只要一开计算立马卡死
HSTB主要是包太少,只能当间断任务挂着,两个多月才挂到一年半
回复

使用道具 举报

发表于 2016-7-18 12:32:33 | 显示全部楼层
vardrag 发表于 2016-7-18 10:54
这些都试过,kill之后还会冒出来,boinc杀掉是没问题,但是还是不能杀包,只要一开计算立马卡死
HSTB主要 ...

去wcg设置好新参数,然后
boinccmd --project http://www.worldcommunitygrid.org reset
会删掉旧任务重置项目
实在不行可以detach然后通过--project_attach再重新添加,linux一般没必要重装系统。
回复

使用道具 举报

发表于 2016-7-20 11:16:12 | 显示全部楼层
mjy 发表于 2016-7-18 10:22
ps axu 查进程PID
kill -9   强制停止并终止进程

pogs右边的奖章你是怎么弄到的?
回复

使用道具 举报

发表于 2016-7-20 23:10:12 | 显示全部楼层
段小猫 发表于 2016-7-20 11:16
pogs右边的奖章你是怎么弄到的?

http://signature.statseb.fr/index.py?badge=204

非CPU密集,还能同时挂两个子项目~~
回复

使用道具 举报

发表于 2016-7-21 06:20:09 | 显示全部楼层
你子机在同一内网吗?你是用了BAM吗?不会设置用win来控制Linux的话我可以帮你。
回复

使用道具 举报

 楼主| 发表于 2016-7-21 10:42:47 | 显示全部楼层
kylinblue 发表于 2016-7-21 06:20
你子机在同一内网吗?你是用了BAM吗?不会设置用win来控制Linux的话我可以帮你。
...

bam添加不了项目,总是出错,windows我现在就一办公虚拟机。远程控制你说的是boinc客户端的那个功能吗?那个总觉得很麻烦的样子。
回复

使用道具 举报

发表于 2016-7-21 12:27:09 | 显示全部楼层
vardrag 发表于 2016-7-20 21:42
bam添加不了项目,总是出错,windows我现在就一办公虚拟机。远程控制你说的是boinc客户端的那个功能吗? ...

win控制win我还没搞出来,win控制linux我现在有三台,操作其实很简单。QQ群号是什么来着

回复

使用道具 举报

发表于 2016-7-22 09:44:09 | 显示全部楼层
the-who 发表于 2016-7-20 23:10
http://signature.statseb.fr/index.py?badge=204

非CPU密集,还能同时挂两个子项目~~

已添加,感谢
回复

使用道具 举报

 楼主| 发表于 2016-7-22 10:04:19 | 显示全部楼层
kylinblue 发表于 2016-7-21 12:27
win控制win我还没搞出来,win控制linux我现在有三台,操作其实很简单。QQ群号是什么来着

...

好像是543631162
回复

使用道具 举报

发表于 2016-7-22 15:45:03 | 显示全部楼层
vardrag 发表于 2016-7-21 10:42
bam添加不了项目,总是出错,windows我现在就一办公虚拟机。远程控制你说的是boinc客户端的那个功能吗? ...

我那台4P的6272前几天跑HSTB爆包,大概同时跑了十几个吧,剩下四十几个是FAHH2包,连爆3个HSTB后客户端挂掉了

现在单跑FAAH2啥事没有,难道是HSTB包引起错乱?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-5-9 05:48

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表