散热

来自中国分布式计算总站
Cuihao讨论 | 贡献2013年7月3日 (三) 10:55的版本
跳转到导航 跳转到搜索

计算机工作离不开电。计算过程中,电流会产生热。如果不及时降温,可能会对计算机软硬件造成不良影响,甚至毁损硬件。因此,减少发热有效散热对延长计算机使用寿命至关重要。

对于参与分布式计算的设备,由于CPU/GPU长期处于满负荷运转状态,发热远强于普通用户,散热更为重要。

散热的方法大致可分为三类:

  1. 改善外部环境,如环境温度、通风条件。
  2. 改善硬件,使用低功耗设备或使用特殊的散热设备。
  3. 通过软件条件,限制计算强度。

改善外部环境

一般而言,在夏季计算机硬件温度会明显高于冬季。这里外部环境是主要的影响因素。

将计算机安放在通风良好的位置、配有空调的房间都可以改善散热。

不要在机箱附近放置杂物,尤其是散热口/风扇附近,否则可能阻碍热空气流通。

改善硬件条件

  • 同性能条件下,较新的硬件往往功耗更低,因此更换新设备也是减少发热的途径。
  • 很多硬件在待机状态下仍会产热,去除不使用的硬件既可节省电力,又能改善机箱通风。
  • 更换更为强力的散热设备,如热管、大风量风扇、液冷设备。
  • 计算机,特别是热负荷高的计算机,容易在风扇等位置积灰,所以应定期清理。

笔记本电脑及其他移动设备

对比台式机,移动设备注重“便携性”,往往设备集成度较高,不利于散热。另外,移动设备的硬件注重低能耗,往往会牺牲性能来换取续航时间,计算性能较弱。

一般情况下,不建议使用移动设备进行CPU/GPU密集型计算,尤其是在散热不佳的机型上。

警告: 如果要使用移动设备进行CPU/GPU密集型计算,请使用硬件监控软件保护您的机器,以避免不必要的硬件损伤。

软件设置

限制 CPU/GPU 使用

BOINC Manager 的“计算参数设置”中,可以限制 BOINC 的 CPU 使用率和占用的 CPU 核心数。

BOINC 无法根据硬件温度动态调整 CPU 使用率。软件 TThrottle 实现了这一功能,它会监视硬件温度,当超过指定阀值时,软件将限制计算程序的 CPU 使用率。

对于 GPU 计算,往往也可以利用 TThrottle 通过限制计算程序的 CPU 占用抑制 GPU 使用。

降低 CPU 频率

与超频相对应,也可以降低 CPU 频率,牺牲一定性能来避免高温。

一般情况下,BIOS 中提供了相关设置,请阅读 BIOS 说明获取具体设置方法。

对于较新的CPU和操作系统,也支持软件设置。具体方法因操作系统而异:

Windows

对于 Windows 7,打开“控制面板”,进入“电源选项”。此时,可以选择电源计划(默认为“平衡”)。你可以新建或修改现有计划,然后点击右边的“更改计划设置”,再进入新页面的“更改高级电源设置”。在弹出的窗口中,有一项“处理器电源管理”,可以设置 CPU 频率调整范围。若要降温,建议将最高频率限制调低。

此外,也有第三方软件可以用来调节CPU频率。如 CrystalCPUID (可能不支持最新的CPU),适用于 Windows XP、2003 等旧版操作系统。

Linux

如果系统支持您的 CPU 的频率调节,可以直接通过内核接口调整 CPU 频率或性能方案。相关文件接口在 /sys/devices/system/cpu/cpu0/cpufreq/ 中。

还可以借助 cpufreq-set(Ubuntu、Debian 等)或 cpupower(Arch、Gentoo 等)命令行工具,手动调整 CPU 的频率或性能管理方案。

Gnome、Unity、KDE 等桌面环境,工具栏部件中包含 CPU 频率调节/监视工具,亦可用于 CPU 降频。

降低 CPU/GPU 工作电压

警告: 过低的电压将导致硬件无法正常工作,甚至损坏硬件。为了安全,请小心地更改相关设置。

电流是硬件产热的原因。因此,降低CPU/GPU工作电压可以有效减少产热。

一般而言,现代的 CPU/GPU 都设置了几个性能档次,低性能运作时工作电压也较低。所以利用上文的降频方法即可实现降压。此外,很多机型的 BIOS 中提供了相关设置,请阅读 BIOS 说明获取具体设置方法。

某些硬件也支持软件配置。Windows 下,CrystalCPUIDRMClock(长期未更新,慎用)可以更改相关设置。Linux 下,应用 phc 内核补丁后,可以调整部分 CPU 型号的电压设置。

降低 GPU 频率

在温度较高时,可以尝试降低GPU频率。

  • 首先尝试降低显存频率(GPU Memory Clock)和核心频率(GPU Core Clock)。只要不构成使GPU占用率大幅降低的瓶颈,就可以降低很多。(其中如 Folding@homePOEM@HOME 一类的蛋白质折叠项目显存控制器占用极低,可以大幅降频)
  • 如果温度还是很高,就只能尝试降低流处理器(Shader)频率。由于流处理器是GPU计算的主要工具,将不可避免地降低性能。

相关软件:

  • MSI Afterburner(Windows,适用于 NVIDIA、AMD 显卡)
  • NVIDIA Inspector(Windows,适用于 NVIDIA 显卡)
  • Rivatuner(Windows,适用于旧型号的 NVIDIA 显卡)
  • nvidia-config(Linux,NVIDIA 官方工具,闭源驱动内置)

此外,也可以通过修改显卡 BIOS 永久降频、降压。但此方法较为危险,可能导致硬件毁损。

增大 CPU/GPU 风扇转速

增大 GPU 风扇转速是加强散热的惯用方法。一般而言,计算机会根据硬件温度自动调节风扇转速,不必人工干预。

警告: 增大风扇转速可能会影响风扇的使用寿命。

但也可以手动调整,把风扇转速固定到最大以改善散热。一般的超频软件都有这种功能。