汉口江岸区城市建设局网站,wordpress和di,北京门户网,美工需要会哪些软件对于GPU相关参数介绍
使用命令周期性查看GPU运行情况最常用的参数是 -n#xff0c; 后面指定是每多少秒来执行一次命令。监视显存#xff1a;设置为每 1s 显示一次显存的情况#xff1a;使用命令ctrlz退出
watch -n 1 nvidia-smi 参数介绍
Fan#xff1a;显示风扇转速 后面指定是每多少秒来执行一次命令。监视显存设置为每 1s 显示一次显存的情况使用命令ctrlz退出
watch -n 1 nvidia-smi 参数介绍
Fan显示风扇转速数值在0到100%之间是计算机的期望转速如果计算机不是通过风扇冷却或者风扇坏了显示出来就是N/A实际情况下如果风扇堵转可能打不到显示的转速。有的设备不会返回转速因为它不依赖风扇冷却而是通过其他外设保持低温比如将服务器放在空调房间里。Temp显卡内部的温度单位是摄氏度Perf表征性能状态从P0到P12P0表示最大性能P12表示状态最小性能Persistence-M是持续模式的状态持续模式虽然耗能大但是在新的GPU应用启动时花费的时间更少这里显示的是off的状态。Pwr能耗表示Bus-Id涉及GPU总线的相关信息Disp.A是Display Active的意思表示GPU的显示是否初始化Memory Usage显存的使用率Volatile GPU-Util浮动的GPU利用率Compute M计算模式参考链接
Intel
安装intel-gpu-tools工具
yum install intel-gpu-tools
//安装完毕后 系统中会多种三个gpu工具 intel_gpu_abrt intel_gpu_time intel_gpu_top其中常用的是intel_gpu_top和intel_gpu_time。
指定GPU、CPU运行
在多GPU系统里使用单一GPU。为了获取 operations 和 Tensor 被指派到哪个设备上运行, 用 log_device_placement 新建一个 session, 并设置为 Truetensorflow
# 新建一个 graph.
with tf.device(/gpu:0):a tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape[2, 3], namea)b tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape[3, 2], nameb)c tf.matmul(a, b)
# 新建 session with log_device_placement 并设置为 True.
sess tf.Session(configtf.ConfigProto(log_device_placementTrue))
# 运行这个 op.
print sess.run(c)
kreas
import os
os.environ[CUDA_VISIBLE_DEVICES] 0 if on_server is False else 0,1
参考命令