Keyco 发表于 2023-3-23 17:10:22

涡轮4090 PPD表现 【虚拟机直通环境】

本帖最后由 Keyco 于 2023-3-23 17:49 编辑

这块涡轮4090是用来做CUDA计算调研用的,这几天闲着就拿来跑跑看效果。【跑在PVE虚拟机直通环境下】


对比下来发现:

[*]魔鹰核心频率是2775,而涡轮只有2700
[*]温度魔鹰较低(开放式机架)基本稳定再53~54℃之间,涡轮稍高61~63℃之间
[*]同样的包18213,魔鹰TPF是24~25秒之间波动,涡轮4090是26~28秒之间波动差距约10%。
[*]在folding中,魔鹰GPU占用很稳,可以长期稳定在98%占用率;而涡轮4090一致会在80~90+之间波动,甚至会低到70%多。最高占用也只有95%
[*]魔鹰所在电脑是12900KS OC 5.5GHz,而虚拟机CPU是基频2.2GHz,2.8GHz turbo的E5 2696 V4 (会考虑拆下来跑在12900KS上试试看)







zflowers 发表于 2023-3-24 09:02:36

按理说2696V4也不差了,看看换到12900KS的对比结果

Keyco 发表于 2023-3-24 11:11:29

在研究ubuntu超频的事情,挖矿的软件可以超,为啥我这个超不了,头大。
研究好了换涡轮到12900ks上面试一下。

Keyco 发表于 2023-3-27 22:58:54

本帖最后由 Keyco 于 2023-3-27 23:11 编辑

涡轮4090被我挪到了机架上开跑,由于风道的原因,散热不是太给力。
仔细看了一下,跑的时候的核心电压和魔鹰不一样,魔鹰是常见的1.05V,而涡轮4090是1.01V

GPU 00000000:02:00.0
    Product Name                        : NVIDIA GeForce RTX 4090
    Product Brand                         : GeForce
    Product Architecture                  : Ada Lovelace
    Display Mode                        : Disabled
    Display Active                        : Disabled
    Persistence Mode                      : Enabled
    MIG Mode
      Current                           : N/A
      Pending                           : N/A
    Accounting Mode                     : Disabled
    Accounting Mode Buffer Size         : 4000
    Driver Model
      Current                           : N/A
      Pending                           : N/A
    Serial Number                         : N/A
    GPU UUID                              : GPU-7102375d-9b41-c59a-70c7-3c079395024d
    Minor Number                        : 1
    VBIOS Version                         : 95.02.18.C0.09
    MultiGPU Board                        : No
    Board ID                              : 0x200
    Board Part Number                     : N/A
    GPU Part Number                     : 2684-300-A1
    Module ID                           : 1
    Inforom Version
      Image Version                     : G002.0000.00.03
      OEM Object                        : 2.0
      ECC Object                        : 6.16
      Power Management Object         : N/A
    GPU Operation Mode
      Current                           : N/A
      Pending                           : N/A
    GSP Firmware Version                  : N/A
    GPU Virtualization Mode
      Virtualization Mode               : None
      Host VGPU Mode                  : N/A
    IBMNPU
      Relaxed Ordering Mode             : N/A
    PCI
      Bus                               : 0x02
      Device                            : 0x00
      Domain                            : 0x0000
      Device Id                         : 0x268410DE
      Bus Id                            : 00000000:02:00.0
      Sub System Id                     : 0x167C10DE
      GPU Link Info
            PCIe Generation
                Max                     : 3
                Current                   : 3
                Device Current            : 3
                Device Max                : 4
                Host Max                  : 3
            Link Width
                Max                     : 16x
                Current                   : 8x
      Bridge Chip
            Type                        : N/A
            Firmware                      : N/A
      Replays Since Reset               : 0
      Replay Number Rollovers         : 0
      Tx Throughput                     : 376000 KB/s
      Rx Throughput                     : 49000 KB/s
      Atomic Caps Inbound               : N/A
      Atomic Caps Outbound            : N/A
    Fan Speed                           : 59 %
    Performance State                     : P0
    Clocks Throttle Reasons
      Idle                              : Not Active
      Applications Clocks Setting       : Not Active
      SW Power Cap                      : Not Active
      HW Slowdown                     : Not Active
            HW Thermal Slowdown         : Not Active
            HW Power Brake Slowdown       : Not Active
      Sync Boost                        : Not Active
      SW Thermal Slowdown               : Not Active
      Display Clock Setting             : Not Active
    FB Memory Usage
      Total                           : 23028 MiB
      Reserved                        : 337 MiB
      Used                              : 548 MiB
      Free                              : 22141 MiB
    BAR1 Memory Usage
      Total                           : 256 MiB
      Used                              : 5 MiB
      Free                              : 251 MiB
    Compute Mode                        : Default
    Utilization
      Gpu                               : 97 %
      Memory                            : 6 %
      Encoder                           : 0 %
      Decoder                           : 0 %
    Encoder Stats
      Active Sessions                   : 0
      Average FPS                     : 0
      Average Latency                   : 0
    FBC Stats
      Active Sessions                   : 0
      Average FPS                     : 0
      Average Latency                   : 0
    Ecc Mode
      Current                           : Enabled
      Pending                           : Enabled
    ECC Errors
      Volatile
            SRAM Correctable            : 0
            SRAM Uncorrectable            : 0
            DRAM Correctable            : 0
            DRAM Uncorrectable            : 0
      Aggregate
            SRAM Correctable            : 0
            SRAM Uncorrectable            : 0
            DRAM Correctable            : 0
            DRAM Uncorrectable            : 0
    Retired Pages
      Single Bit ECC                  : N/A
      Double Bit ECC                  : N/A
      Pending Page Blacklist            : N/A
    Remapped Rows
      Correctable Error               : 0
      Uncorrectable Error               : 0
      Pending                           : No
      Remapping Failure Occurred      : No
      Bank Remap Availability Histogram
            Max                           : 192 bank(s)
            High                        : 0 bank(s)
            Partial                     : 0 bank(s)
            Low                           : 0 bank(s)
            None                        : 0 bank(s)
    Temperature
      GPU Current Temp                  : 65 C
      GPU T.Limit Temp                  : 19 C
      GPU Shutdown Temp               : 104 C
      GPU Slowdown Temp               : 99 C
      GPU Max Operating Temp            : 90 C
      GPU Target Temperature            : 84 C
      Memory Current Temp               : N/A
      Memory Max Operating Temp         : N/A
    Power Readings
      Power Management                  : Supported
      Power Draw                        : 272.65 W
      Power Limit                     : 450.00 W
      Default Power Limit               : 450.00 W
      Enforced Power Limit            : 450.00 W
      Min Power Limit                   : 150.00 W
      Max Power Limit                   : 450.00 W
    Clocks
      Graphics                        : 2700 MHz
      SM                              : 2700 MHz
      Memory                            : 10501 MHz
      Video                           : 2070 MHz
    Applications Clocks
      Graphics                        : N/A
      Memory                            : N/A
    Default Applications Clocks
      Graphics                        : N/A
      Memory                            : N/A
    Deferred Clocks
      Memory                            : N/A
    Max Clocks
      Graphics                        : 3105 MHz
      SM                              : 3105 MHz
      Memory                            : 10501 MHz
      Video                           : 2415 MHz
    Max Customer Boost Clocks
      Graphics                        : N/A
    Clock Policy
      Auto Boost                        : N/A
      Auto Boost Default                : N/A
    Voltage
      Graphics                        : 1010.000 mV
    Fabric
      State                           : N/A
      Status                            : N/A
    Processes
      GPU instance ID                   : N/A
      Compute instance ID               : N/A
      Process ID                        : 1592
            Type                        : G
            Name                        : /usr/lib/xorg/Xorg
            Used GPU Memory               : 6 MiB
      GPU instance ID                   : N/A
      Compute instance ID               : N/A
      Process ID                        : 29343
            Type                        : C
            Name                        : /var/lib/fahclient/cores/cores.foldingathome.org/lin/64bit/22-0.0.20/Core_22.fah/FahCore_22
            Used GPU Memory               : 538 MiB

可能这个就是频率上不去,tpf慢的罪魁祸首吧。

目前18213包的tpf是25~26秒之间,cpu是12900KS oc 5.5GHz,pcie 3.0 x8。比在2696 V4下 PCIE 3.0 x16 的 26~28秒快一点。仔细看了一下,貌似pcie 3.0 x8也够用。关于CPU频率瓶颈、PCIE带宽瓶颈的边界,会在近日出差后调研。下图是2块卡同时跑18213的对比,第1个GPU是魔鹰,第二个是涡轮。涡轮卡由于已开启显存ECC,所以显存有变少。

新的4090 水超龙在途,届时看看一体水冷 4090和魔鹰的对比。

tjchkj 发表于 2023-9-1 11:00:46

水龙如何了?我觉得可能还是魔鹰强

Keyco 发表于 2023-9-1 12:33:34

tjchkj 发表于 2023-9-1 11:00
水龙如何了?我觉得可能还是魔鹰强

水超龙更强一点。

上图种,GPU0是我第二块水超龙,核心频率可以到2835,核心是A1,不是A0了。GPU1是魔鹰核心A0。GPU2是第一块水超龙,可以看到频率没有第二块高,核心是A0。

下图是包的表现,因为包都不一样,暂时无法横向比较。而且下载的时候耗时不一样,现在很难横向比较了。只是给你一个参考。

特斯拉 发表于 2023-9-4 09:24:26

这代我看别人测试技嘉的比较安静不啸叫
页: [1]
查看完整版本: 涡轮4090 PPD表现 【虚拟机直通环境】

论坛官方淘宝店开业啦~