找回密码
 新注册用户
搜索
查看: 7570|回复: 17

[分享] 艾滋病还是大面积无效,暂停计算

[复制链接]
发表于 2015-12-30 19:39:31 | 显示全部楼层 |阅读模式
本帖最后由 vardrag 于 2015-12-30 19:44 编辑

还好有个金牌。同期的结果少数有效,难道又是网络的问题?
回复

使用道具 举报

发表于 2015-12-30 19:47:17 | 显示全部楼层
先换个别的项目刷。
回复

使用道具 举报

发表于 2015-12-30 20:20:11 | 显示全部楼层
是ES的U么?

难道对AVX支持有问题?
回复

使用道具 举报

 楼主| 发表于 2015-12-30 20:25:07 | 显示全部楼层
金鹏 发表于 2015-12-30 20:20
是ES的U么?

难道对AVX支持有问题?

是ES,但是hwinfo可以看到SSPEC,跟盖子上写的一样,所以我认为跟正式版没有区别(那U网上没有任何信息,不知道正式版什么样)。
回复

使用道具 举报

发表于 2015-12-30 20:28:49 | 显示全部楼层
vardrag 发表于 2015-12-30 20:25
是ES,但是hwinfo可以看到SSPEC,跟盖子上写的一样,所以我认为跟正式版没有区别(那U网上没有任何信息, ...

只跑一个FAH2任务试个一天看看单线程还会出错否?
回复

使用道具 举报

 楼主| 发表于 2015-12-30 20:35:09 | 显示全部楼层
金鹏 发表于 2015-12-30 20:28
只跑一个FAH2任务试个一天看看单线程还会出错否?

我批量计算之前就先算了一个,结果就有效,然后就被坑了
回复

使用道具 举报

 楼主| 发表于 2015-12-30 20:50:20 | 显示全部楼层
金鹏 发表于 2015-12-30 20:28
只跑一个FAH2任务试个一天看看单线程还会出错否?

可能真是网络问题。
无效结果大部分未经验证,另外两个还在计算,我就被pass掉了,有些甚至是上传之后立刻就无效。
刚刚上传的十几个结果全部有效,区别就是它们是随算随传,无效的大部分来自恢复网络之后的集中上传。
看起来我目前的网络状况比较适合小包。
回复

使用道具 举报

发表于 2015-12-30 20:53:43 | 显示全部楼层
vardrag 发表于 2015-12-30 20:50
可能真是网络问题。
无效结果大部分未经验证,另外两个还在计算,我就被pass掉了,有些甚至是上传之后立 ...

你的网络存量设置1天,试试看,FAH2只有4天有效期,屯包过多会产生过期无效
回复

使用道具 举报

 楼主| 发表于 2015-12-30 20:58:08 | 显示全部楼层
金鹏 发表于 2015-12-30 20:53
你的网络存量设置1天,试试看,FAH2只有4天有效期,屯包过多会产生过期无效

我是今天一起算了一批任务,中间断网一次,恢复之后有部分已经算完,部分还在计算。先行上传的这批基本上都无效,刚刚网络通畅时算完的一批就有效。
这批任务基本上是同时接的,如果是设置的问题,不会出现两种情况吧?
回复

使用道具 举报

 楼主| 发表于 2015-12-30 21:00:15 | 显示全部楼层
金鹏 发表于 2015-12-30 20:53
你的网络存量设置1天,试试看,FAH2只有4天有效期,屯包过多会产生过期无效

等我这机器均分稳定之后我要测试一下,断网之前暂停计算,保证计算时网络通畅,看看是否还会无效。
回复

使用道具 举报

发表于 2015-12-30 21:29:25 来自手机 | 显示全部楼层
机器跑过稳定性压力测试没?
回复

使用道具 举报

 楼主| 发表于 2015-12-30 21:34:38 | 显示全部楼层
muclemanxb 发表于 2015-12-30 21:29
机器跑过稳定性压力测试没?

FPU还是P95?有这必要吗?
回复

使用道具 举报

发表于 2015-12-30 22:27:02 | 显示全部楼层
vardrag 发表于 2015-12-30 21:34
FPU还是P95?有这必要吗?

ORTHOS、linx都试试看我的网络也算是差了(每天半夜百度都打不开,那时候上报的WU都要延时等待9个甚至18个小时重试的),也从来没出现过你这种~除了自身稳定性,目前你还有其他能怀疑的因素吗?
还有,换一个U、换内存试试看。
回复

使用道具 举报

 楼主| 发表于 2015-12-30 22:46:46 | 显示全部楼层
muclemanxb 发表于 2015-12-30 22:27
ORTHOS、linx都试试看我的网络也算是差了(每天半夜百度都打不开,那时候上报的WU都要延时等待9个甚至18 ...

这样我就有疑问了。既然需要对比不同主机的结果,那么为什么我的很多结果没有进行比较就判定无效?今天无效的那几个任务其它主机都是在处理中,服务器凭什么判定我的结果无效?
回复

使用道具 举报

 楼主| 发表于 2015-12-31 09:56:48 | 显示全部楼层
muclemanxb 发表于 2015-12-30 22:27
ORTHOS、linx都试试看我的网络也算是差了(每天半夜百度都打不开,那时候上报的WU都要延时等待9个甚至18 ...

看了一下日志,是因为某种原因计算有中断,于是被判无效。
烤鸡形式的压力测试我是不太相信的。以前买过两张显卡,各种烤鸡一切正常,跑einstein不到10分钟必定黑屏,而einstein的功耗只有默认TDP的80%。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~
欢迎大家多多支持基金会~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-6-26 11:52

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表