散热

来自中国分布式计算总站
跳转到导航 跳转到搜索
Editing icon.png 该页面正在被编辑
用户 cuihao 正在编辑该页面,尚未完工。请其他Wiki用户不要同时编辑,以避免冲突。
该用户的说明:无 。
如果该页面长期无人编辑,请去除该模板并添加上合适的页面状态模板
欢迎无wiki账号的用户到论坛Wiki系统讨论区注册)参与讨论,有账号用户请到讨论:散热发表见解。

计算机工作离不开电。计算过程中,电流会产生热。如果不及时降温,可能会对计算机软硬件造成不良影响,甚至毁损硬件。因此,减少发热有效散热对延长计算机使用寿命至关重要。

对于参与分布式计算的设备,由于CPU/GPU长期处于满负荷运转状态,发热远强于普通用户,散热更为重要。

散热的方法大致可分为三类:

  1. 改善外部环境,如环境温度、通风条件。
  2. 改善硬件,使用低功耗设备或使用特殊的散热设备。
  3. 通过软件条件,限制计算强度。

一般来讲,在“靠近发热设备的地方”改善散热的效果更加明显:

改善外部环境

一般而言,在夏季计算机硬件温度会明显高于冬季。这里外部环境是主要的影响因素。

将计算机安放在通风良好的位置、配有空调的房间都可以改善散热。

不要在机箱附近放置杂物,尤其是散热口/风扇附近,否则可能阻碍热空气流通。

改善硬件条件

  • 同性能条件下,较新的硬件往往功耗更低,因此更换新设备也是减少发热的途径。
  • 很多硬件在待机状态下仍会产热,去除不使用的硬件既可节省电力,又能改善机箱通风。
  • 更换更为强力的散热设备,如热管、大风量风扇、液冷设备。

笔记本电脑及其他移动设备

对比台式机,移动设备注重“便携性”,往往设备集成度较高,不利于散热。另外,移动设备的硬件注重低能耗,往往会牺牲性能来换取续航时间,计算性能较弱。

一般情况下,不建议使用移动设备进行CPU/GPU密集型计算,尤其是在散热不佳的机型上。

警告: 如果要使用移动设备进行CPU/GPU密集型计算,请使用硬件监控软件保护您的机器,以避免不必要的硬件损伤。

软件设置

限制CPU/GPU使用

BOINC Manager 的“计算参数设置”中,可以限制 BOINC 的 CPU 使用率和占用的 CPU 核心数。

BOINC 无法根据硬件温度动态调整 CPU 使用率。软件 TThrottle 实现了这一功能,它会监视硬件温度,当超过指定阀值时,软件将限制计算程序的 CPU 使用率。

对于 GPU 计算,往往也可以利用 TThrottle 通过限制计算程序的 CPU 占用抑制 GPU 使用。

通过软件降低 CPU/GPU 工作电压

警告: 过低的电压将导致硬件无法正常工作,甚至损坏硬件。为了安全,请小心地更改相关设置。

电流是硬件产热的原因。因此,降低CPU/GPU工作电压可以有效减少产热。

一般而言,现代的 CPU/GPU 都设置了几个性能档次,低性能运作时工作电压也较低。此外,很多机型的 BIOS 中提供了相关设置,请阅读 BIOS 说明获取具体设置方法。

某些硬件也支持软件配置。Windows 下,CrystalCPUIDRMClock(长期未更新,慎用)可以更改相关设置。Linux 下,应用 phc 内核补丁后,可以调整部分 CPU 型号的电压设置。

降低GPU频率

在温度较高时,可以尝试降低GPU频率。

  • 首先尝试降低显存和核心频率(MemoryClock,GPU clock),只要不构成使GPU占用率大幅降低的瓶颈,可以降低很多。(其中如Folding@homePOEM@home一类的蛋白质项目显存控制器占用极低,可以大幅降频)
  • 如果温度高,就只能尝试降低流处理器(Shader)频率。由于流处理器是GPU计算的主要工具,速度将不可避免地降低。

有关的工具:

  • nVidia GPU
  1. nvidia Inspector,降压降频(还可以在温度不高时进行超频)
  2. NiBiTor 改BIOS
  3. MagicPanel HD 写BIOS
  • ATI/AMD GPU
  1. TechPowerUp Radeon Bios Editor 改BIOS