yu3peng / blog-comments

0 stars 0 forks source link

GPU — Yu Peng #53

Open yu3peng opened 4 years ago

yu3peng commented 4 years ago

https://www.y2p.cc/notes/gpu/

yu3peng commented 4 years ago

NVIDIA GPU 压力测试:nvidia-docker run --rm chrstnhntschl/gpu_burn 180

yu3peng commented 4 years ago

NVIDIA PLASTER:一个与深度学习性能有关的框架

yu3peng commented 4 years ago

一个 MFLOPS (megaFLOPS) 等于每秒1百万 (=10^6) 次的浮点运算 一个 GFLOPS (gigaFLOPS) 等于每秒10亿 (=10^9) 次的浮点运算 一个 TFLOPS (teraFLOPS) 等于每秒1万亿 (=10^12) 次的浮点运算 一个 PFLOPS (petaFLOPS) 等于每秒1千万亿 (=10^15) 次的浮点运算

yu3peng commented 4 years ago

VGPU 技术是用来提高虚拟机的浮点运算、并行计算能力,对虚拟机图像的远程输出到终端上的流畅程度没有实质性的帮助。云主机云服务注重的是运算能力;云桌面注重的是前端桌面的交互体验,所有的远程桌面传输协议都对图像进行了有损压缩,远端虚拟机输出的帧通过网络传输到终端(盒子)时图像实际已经进行了裁减;即使后端虚拟机上的VGPU渲染了一张4K 的32位真彩图像,通过远程桌面传输协议回显(终端盒子收到加密压缩的数据后把数据还原成图像) 到终端显示器上被用户肉眼看到之时其实已经是缩水后的复刻品。 其于VDI 的云桌面在高密集图像处理方面表现不佳其瓶颈也并不在后端的GPU不足,而且网络传输的损失与前端能力的不足。在窄带宽与瘦终端环境表现得更明显。

云桌面三大谎言之GPU虚拟化

yu3peng commented 4 years ago

# NVIDIA & Container # 浅谈 docker 挂载 GPU 原理

docker run --device /dev/nvidia0:/dev/nvidia0 --device /dev/nvidiactl:/dev/nvidiactl --device /dev/nvidia-uvm:/dev/nvidia-uvm --device /dev/nvidia-uvm-tools:/dev/nvidia-uvm-tools --device /dev/nvidia-modeset:/dev/nvidia-modeset -v /usr/bin/:/usr/bin -v /usr/lib64:/usr/lib64 -it tkestack/vcuda:1.0 bash

yu3peng commented 4 years ago

# NVIDIA & Container # Docker >= 19.03 docker run --gpus all,capabilities=utilities nvidia/cuda nvidia-smi

yu3peng commented 4 years ago

# NVIDIA & Container # 容器中需要挂载的NVIDIA文件,具体信息可以参考tencent gpu-manager 挂载配置文件,其中 libcuda-control.so 文件来源于dockerhub 上 tencent vcuda容器中的 usr\lib64\libcuda-control.so文件

yu3peng commented 4 years ago

# NVIDIA FAQ #

Q: /dev/nvidia-uvm: no such file or directory.

A:

sudo /sbin/modprobe nvidia-uvm
D=`grep nvidia-uvm /proc/devices | awk '{print $1}'`  
sudo mknod -m 666 /dev/nvidia-uvm c $D 0 
ls /dev/nvidia*

https://www.machunjie.com/trouble/88.html

Q: /dev/nvidia-uvm-tools: no such file or directory

A:

sudo mknod -m 666 /dev/nvidia-uvm-tools c $(grep nvidia-uvm /proc/devices | awk '{print $1}') 1

https://github.com/NVIDIA/nvidia-docker/issues/526

yu3peng commented 4 years ago

Ring3下Hook API实现分析

yu3peng commented 4 years ago

# 推荐算法 # 基于Slope One的推荐引擎

# 推荐算法 # 复杂算法转化为简单算法,高阶算法转化为低阶算法

yu3peng commented 4 years ago

# NVIDIA & CT #

老黄放大招,NVIDIA推出用于5G网络的SDR方案

爱立信和NVIDIA合作,通过GPU加速虚拟化5G无线接入网

yu3peng commented 4 years ago

CUDA编程入门极简教程

yu3peng commented 4 years ago

阿里云容器服务Kubernetes 基于GPU指标自动伸缩

yu3peng commented 4 years ago

KubeOperator 是一个开源项目,通过 Web UI 在 VMware、OpenStack 和物理机上规划、部署和运营生产级别的 Kubernetes 集群。支持内网离线环境、支持 GPU、内置应用商店,已通过 CNCF 的 Kubernetes 软件一致性认证。

yu3peng commented 4 years ago

GPU Operator是一个由Helm chart所部署的云原生方法,针对GPU支持的Kubernetes系统配置,用于自动部署所有必要的组件,并完成组件标准化。NVIDIA、Red Hat及云原生社区内的其他公司协作创建了GPU Operator

yu3peng commented 4 years ago

京东云添加GPU工作节点组

京东云部署自定义版本的NVIDIA GPU驱动

yu3peng commented 4 years ago

老黄刀法:

电脑这玩意里面有两个科幻无比的东西,人类的智慧结晶:CPU、GPU。

你也可以叫它CPU和显卡。CPU负责什么?那可就……不重要。

电脑这玩意有显示器,光一个CPU电脑可运行不到桌面,所以部分CPU会集成显卡,也就是"核显",它确保你的电脑可以运行到桌面并且让显示器显示出来内容。

那有的人呢,肯定是不满足于看视频、看小说、听音乐、上上网,电脑嘛,不能打游戏那能叫电脑吗?但是游戏呢,它的运算量不小,比如一个正方体,它有6个面,每个面什么颜色,长宽高多少。如果画个圆球呢?计算量就更大了。

还别说得计算这个球往地上一扔会朝哪里滚,滚动的过程你也得画出来吧?所以要把游戏"画出来"是一件很复杂很复杂的事,那么多小人、建筑、枪车球的都得显示出来。

"核显"说:哥,我一分钟只能算一个1+1=2,你让我算2+2=4我算不过来啊!

因此有了独立显卡,独显。独显块头大,力气大,跑的也快。

独显说:小弟你歇着,我来。

歘歘歘,一副立体的画面就跃然于屏幕之上。

但是呢,游戏也是越来越复杂,以前呢,可能就是超级马里奥就很好玩了,后来呢?得玩英雄联盟、王者荣耀,最开始的独显也应付不过来了,这时候,跑出来四个哥们,一起吼道:我来!这四个哥们呢,是老黄家得,可能分别叫X50、X60、X70、X80。

这时候又有两个概念:分辨率、帧率。你要是用10年前的手机看片,是不是一坨马赛克?你用现在上千的手机看片,好清晰啊。

横着2个灯,竖着2个灯,组成一个屏幕,你啥都看不清;但是横着1920个灯,竖着1080个灯,组成一个屏幕,就很清晰了,这就是分辨率。

另一个帧率呢,翻页动画见过没,你把100张纸上画个小人,每一张略微动一丁点,连续着翻看,小人就动起来了,那么一秒钟你要是只翻一张,你就觉得:怎么这么卡?所以你一秒钟翻60页,动画瞬间流畅!

X50小弟说:这个游戏啊,这个低分辨率的,我能达到30帧/秒,啊,勉强能玩。

X60说:这游戏啊,中等分辨率,我能50帧/秒,玩起来还不错。

X70跳出来:超高清分辨率,60帧/秒,又清晰又流畅,爽快。

X80躺在那:4K超级无敌爆炸分辨率,120帧/秒,享受。

所以这四兄弟分别对应999块、1999块、3999块、6999块。

这时候,突然你跑出来,说我家这R58的身材,能2599给你接近X70的体验(虽然实际可能差一些)。

老黄家的四兄弟一看,不好!这人是来捣乱的!X70你看,委屈你一下,砍你一刀行不?

X70咬咬牙:好,听老爸你的。

咔嚓一刀,X65出来了,2499块!比你X58便宜100!性能和你一样!

你一看,我去,我还没开始卖呢,你这X65卡的档位,比我便宜还比我好一丁点,我这R58怎么卖?卖不出去都砸手里了呀!

这就是黄氏刀法。

yu3peng commented 4 years ago

老黄两弹功勋:

...因为超频后的英伟达显卡经常导致买家们的主板、电源全损,运气不好的内存都被烧掉。所以,在那些玩家看来,他的显卡成了一枚“ 战术核弹 ”。当然, “ 核弹狂魔 ” 这个名号,怎么会如此简单降临到一个人类身上?

相对于他的产品,其实老黄的脾气更像是一枚核弹。他被称为IT届最好斗的人,硅谷一霸,并且从不怕得罪任何人。。。

据不完全统计,黄仁勋得罪过AMD、Intel、微软、苹果、讯景等大型企业。

由于老黄他 “ 桀骜不驯 ” 的显卡,几乎得过罪所有的游戏厂商。

因为这些游戏厂商的游戏,在他的显卡配置下,要么跑不动,要么游戏效果不理想。。。

曾经,许多玩家反映,老黄最新的N卡带不动北软(即北京软星科技有限公司)开发的游戏 “ 仙剑奇侠传六 ” 。

以自身产品为自豪的老黄顿时感觉面上无光、气急败坏,扬言要炸掉北软的公司。。。

yu3peng commented 4 years ago

AR / MR / VR / XR有什么区别

yu3peng commented 4 years ago

NVIDIA GTC 2020

yu3peng commented 4 years ago

yu3peng commented 4 years ago

rCUDA

yu3peng commented 4 years ago

趋动科技

使用Helm部署OrionX

OrionX计算平台(猎户座计算平台)

yu3peng commented 4 years ago

awesome-k8s-gpu-sharing-resources

yu3peng commented 4 years ago

Fractional GPUs: Software-based Compute and Memory Bandwidth Reservation for GPUs

yu3peng commented 2 years ago

NVIDIA Releases Open-Source GPU Kernel Modules

yu3peng commented 2 years ago

NVIDIA open-gpu-kernel-modules