涡轮4090 PPD表现 【虚拟机直通环境】
本帖最后由 Keyco 于 2023-3-23 17:49 编辑这块涡轮4090是用来做CUDA计算调研用的,这几天闲着就拿来跑跑看效果。【跑在PVE虚拟机直通环境下】
对比下来发现:
[*]魔鹰核心频率是2775,而涡轮只有2700
[*]温度魔鹰较低(开放式机架)基本稳定再53~54℃之间,涡轮稍高61~63℃之间
[*]同样的包18213,魔鹰TPF是24~25秒之间波动,涡轮4090是26~28秒之间波动差距约10%。
[*]在folding中,魔鹰GPU占用很稳,可以长期稳定在98%占用率;而涡轮4090一致会在80~90+之间波动,甚至会低到70%多。最高占用也只有95%
[*]魔鹰所在电脑是12900KS OC 5.5GHz,而虚拟机CPU是基频2.2GHz,2.8GHz turbo的E5 2696 V4 (会考虑拆下来跑在12900KS上试试看)
按理说2696V4也不差了,看看换到12900KS的对比结果 在研究ubuntu超频的事情,挖矿的软件可以超,为啥我这个超不了,头大。
研究好了换涡轮到12900ks上面试一下。 本帖最后由 Keyco 于 2023-3-27 23:11 编辑
涡轮4090被我挪到了机架上开跑,由于风道的原因,散热不是太给力。
仔细看了一下,跑的时候的核心电压和魔鹰不一样,魔鹰是常见的1.05V,而涡轮4090是1.01V
GPU 00000000:02:00.0
Product Name : NVIDIA GeForce RTX 4090
Product Brand : GeForce
Product Architecture : Ada Lovelace
Display Mode : Disabled
Display Active : Disabled
Persistence Mode : Enabled
MIG Mode
Current : N/A
Pending : N/A
Accounting Mode : Disabled
Accounting Mode Buffer Size : 4000
Driver Model
Current : N/A
Pending : N/A
Serial Number : N/A
GPU UUID : GPU-7102375d-9b41-c59a-70c7-3c079395024d
Minor Number : 1
VBIOS Version : 95.02.18.C0.09
MultiGPU Board : No
Board ID : 0x200
Board Part Number : N/A
GPU Part Number : 2684-300-A1
Module ID : 1
Inforom Version
Image Version : G002.0000.00.03
OEM Object : 2.0
ECC Object : 6.16
Power Management Object : N/A
GPU Operation Mode
Current : N/A
Pending : N/A
GSP Firmware Version : N/A
GPU Virtualization Mode
Virtualization Mode : None
Host VGPU Mode : N/A
IBMNPU
Relaxed Ordering Mode : N/A
PCI
Bus : 0x02
Device : 0x00
Domain : 0x0000
Device Id : 0x268410DE
Bus Id : 00000000:02:00.0
Sub System Id : 0x167C10DE
GPU Link Info
PCIe Generation
Max : 3
Current : 3
Device Current : 3
Device Max : 4
Host Max : 3
Link Width
Max : 16x
Current : 8x
Bridge Chip
Type : N/A
Firmware : N/A
Replays Since Reset : 0
Replay Number Rollovers : 0
Tx Throughput : 376000 KB/s
Rx Throughput : 49000 KB/s
Atomic Caps Inbound : N/A
Atomic Caps Outbound : N/A
Fan Speed : 59 %
Performance State : P0
Clocks Throttle Reasons
Idle : Not Active
Applications Clocks Setting : Not Active
SW Power Cap : Not Active
HW Slowdown : Not Active
HW Thermal Slowdown : Not Active
HW Power Brake Slowdown : Not Active
Sync Boost : Not Active
SW Thermal Slowdown : Not Active
Display Clock Setting : Not Active
FB Memory Usage
Total : 23028 MiB
Reserved : 337 MiB
Used : 548 MiB
Free : 22141 MiB
BAR1 Memory Usage
Total : 256 MiB
Used : 5 MiB
Free : 251 MiB
Compute Mode : Default
Utilization
Gpu : 97 %
Memory : 6 %
Encoder : 0 %
Decoder : 0 %
Encoder Stats
Active Sessions : 0
Average FPS : 0
Average Latency : 0
FBC Stats
Active Sessions : 0
Average FPS : 0
Average Latency : 0
Ecc Mode
Current : Enabled
Pending : Enabled
ECC Errors
Volatile
SRAM Correctable : 0
SRAM Uncorrectable : 0
DRAM Correctable : 0
DRAM Uncorrectable : 0
Aggregate
SRAM Correctable : 0
SRAM Uncorrectable : 0
DRAM Correctable : 0
DRAM Uncorrectable : 0
Retired Pages
Single Bit ECC : N/A
Double Bit ECC : N/A
Pending Page Blacklist : N/A
Remapped Rows
Correctable Error : 0
Uncorrectable Error : 0
Pending : No
Remapping Failure Occurred : No
Bank Remap Availability Histogram
Max : 192 bank(s)
High : 0 bank(s)
Partial : 0 bank(s)
Low : 0 bank(s)
None : 0 bank(s)
Temperature
GPU Current Temp : 65 C
GPU T.Limit Temp : 19 C
GPU Shutdown Temp : 104 C
GPU Slowdown Temp : 99 C
GPU Max Operating Temp : 90 C
GPU Target Temperature : 84 C
Memory Current Temp : N/A
Memory Max Operating Temp : N/A
Power Readings
Power Management : Supported
Power Draw : 272.65 W
Power Limit : 450.00 W
Default Power Limit : 450.00 W
Enforced Power Limit : 450.00 W
Min Power Limit : 150.00 W
Max Power Limit : 450.00 W
Clocks
Graphics : 2700 MHz
SM : 2700 MHz
Memory : 10501 MHz
Video : 2070 MHz
Applications Clocks
Graphics : N/A
Memory : N/A
Default Applications Clocks
Graphics : N/A
Memory : N/A
Deferred Clocks
Memory : N/A
Max Clocks
Graphics : 3105 MHz
SM : 3105 MHz
Memory : 10501 MHz
Video : 2415 MHz
Max Customer Boost Clocks
Graphics : N/A
Clock Policy
Auto Boost : N/A
Auto Boost Default : N/A
Voltage
Graphics : 1010.000 mV
Fabric
State : N/A
Status : N/A
Processes
GPU instance ID : N/A
Compute instance ID : N/A
Process ID : 1592
Type : G
Name : /usr/lib/xorg/Xorg
Used GPU Memory : 6 MiB
GPU instance ID : N/A
Compute instance ID : N/A
Process ID : 29343
Type : C
Name : /var/lib/fahclient/cores/cores.foldingathome.org/lin/64bit/22-0.0.20/Core_22.fah/FahCore_22
Used GPU Memory : 538 MiB
可能这个就是频率上不去,tpf慢的罪魁祸首吧。
目前18213包的tpf是25~26秒之间,cpu是12900KS oc 5.5GHz,pcie 3.0 x8。比在2696 V4下 PCIE 3.0 x16 的 26~28秒快一点。仔细看了一下,貌似pcie 3.0 x8也够用。关于CPU频率瓶颈、PCIE带宽瓶颈的边界,会在近日出差后调研。下图是2块卡同时跑18213的对比,第1个GPU是魔鹰,第二个是涡轮。涡轮卡由于已开启显存ECC,所以显存有变少。
新的4090 水超龙在途,届时看看一体水冷 4090和魔鹰的对比。
水龙如何了?我觉得可能还是魔鹰强 tjchkj 发表于 2023-9-1 11:00
水龙如何了?我觉得可能还是魔鹰强
水超龙更强一点。
上图种,GPU0是我第二块水超龙,核心频率可以到2835,核心是A1,不是A0了。GPU1是魔鹰核心A0。GPU2是第一块水超龙,可以看到频率没有第二块高,核心是A0。
下图是包的表现,因为包都不一样,暂时无法横向比较。而且下载的时候耗时不一样,现在很难横向比较了。只是给你一个参考。
这代我看别人测试技嘉的比较安静不啸叫
页:
[1]