nviennot / core-to-core-latency

Measures the latency between CPU cores
MIT License
1.12k stars 84 forks source link

[Result] AMD Ryzen 9 9950X 16-Core Processor #107

Open ubergarm opened 2 months ago

ubergarm commented 2 months ago

The full build specs are at Dual GPU AI and Gaming Workstation

Attached CSV file: output-9950x.csv

I ran this inside docker --rm -it ubuntu /bin/bash after a fresh apt-get install cargo.

$  core-to-core-latency 5000 --csv > output.csv
CPU: AMD Ryzen 9 9950X 16-Core Processor
Num cores: 32
Num iterations per samples: 5000
Num samples: 300

1) CAS latency on a single shared cache line

           0       1       2       3       4       5       6       7       8       9      10      11      12      13      14      15      16      17      18      19      20      21      22      23      24      25      26      27      28      29      30      31
      0
      1   21±0
      2   21±0    22±0
      3   22±0    21±0    21±0
      4   19±0    22±0    17±0    21±0
      5   20±0    22±0    19±0    21±0    19±0
      6   19±0    23±0    18±0    20±0    18±0    21±0
      7   19±0    22±0    19±0    21±0    21±0    18±0    21±0
      8  204±0   210±0   206±0   206±0   209±0   208±0   215±0   216±0
      9  228±0   232±0   215±0   223±0   225±0   205±0   226±0   218±0    22±0
     10  191±0   209±0   199±0   204±0   201±0   189±0   214±0   217±0    22±0    23±0
     11  215±0   219±0   215±0   211±0   213±0   204±0   207±0   208±0    23±0    22±0    22±0
     12  202±0   213±0   213±0   206±0   210±0   195±0   211±0   207±0    20±0    23±0    18±0    22±0
     13  219±0   222±0   219±0   216±0   219±0   200±0   211±0   215±0    21±0    23±0    20±0    23±0    20±0
     14  213±0   206±0   206±0   206±0   202±0   205±0   200±0   203±0    19±0    24±0    19±0    21±0    18±0    22±0
     15  203±0   210±0   212±0   211±0   209±0   208±0   209±0   216±0    20±0    23±0    20±0    22±0    22±0    19±0    22±0
     16   18±0    21±0    21±0    22±0    18±0    20±0    19±0    18±0   199±0   204±0   196±0   199±0   196±0   202±0   193±0   193±0
     17   21±0    18±0    22±0    21±0    23±0    22±0    20±0    23±0   188±0   193±0   185±0   195±0   192±0   194±0   189±0   192±0    21±0
     18   21±0    22±0    18±0    21±0    17±0    19±0    18±0    19±0   212±0   205±0   208±0   203±0   202±0   207±0   199±0   202±0    21±0    22±0
     19   22±0    21±0    21±0    18±0    21±0    21±0    18±0    21±0   208±0   206±0   198±0   205±0   198±0   204±0   201±0   204±0    22±0    21±0    21±0
     20   19±0    22±0    17±0    21±0    18±0    20±0    18±0    21±0   203±0   204±0   205±1   208±0   201±0   204±0   197±0   190±0    19±0    22±0    17±0    21±0
     21   20±0    22±0    18±0    21±0    19±0    18±0    19±0    19±0   204±0   210±0   201±0   204±0   205±0   208±0   204±0   204±0    19±0    22±0    19±0    21±0    19±0
     22   19±0    23±0    18±0    19±0    18±0    21±0    18±0    21±0   204±0   211±0   193±0   203±0   207±0   209±0   203±0   196±0    19±0    23±0    18±0    19±0    18±0    21±0
     23   19±0    22±0    19±0    21±0    21±0    18±0    20±0    18±0   195±0   201±0   198±0   204±0   203±0   206±0   195±0   201±0    19±0    22±0    19±0    21±0    20±0    18±0    20±0
     24  205±0   215±0   207±0   211±0   214±0   208±0   215±0   218±0    19±0    22±0    22±0    23±0    19±0    21±0    20±0    20±0   207±0   210±0   209±0   210±0   212±0   206±0   218±0   215±0
     25  236±0   222±0   223±0   224±0   221±0   212±0   224±0   223±1    22±0    19±0    23±0    23±0    24±0    23±0    21±0    24±0   222±0   215±0   217±0   216±0   214±0   208±0   220±0   229±0    22±0
     26  189±0   209±0   198±0   207±0   200±0   193±0   210±0   210±0    22±0    23±0    19±0    22±0    18±0    20±0    19±0    20±0   203±0   206±0   194±0   199±0   199±0   199±0   207±0   207±0    22±0    23±0
     27  214±0   214±0   214±0   209±0   210±0   212±0   206±0   203±0    23±0    22±0    22±0    18±0    22±0    23±0    19±0    22±0   221±0   215±0   220±0   220±0   220±0   212±0   215±0   218±0    23±0    22±0    22±0
     28  199±0   217±0   208±0   216±0   217±0   189±0   216±0   211±0    19±0    23±0    18±0    22±0    19±0    21±0    19±0    22±0   214±0   216±0   208±0   211±0   212±0   188±0   217±0   219±0    20±0    23±0    18±0    22±0
     29  221±0   224±0   227±0   224±0   222±0   208±0   217±0   222±0    21±0    23±0    20±0    23±0    20±0    19±0    20±0    20±0   211±0   229±0   221±0   216±0   217±0   209±0   209±0   197±0    21±0    23±0    20±0    22±0    20±0
     30  210±0   208±0   206±0   205±0   200±0   198±0   207±0   194±0    21±0    24±0    19±0    21±0    19±0    22±0    19±0    22±0   209±0   212±0   206±0   204±0   199±0   195±0   203±0   194±0    21±0    24±0    19±0    21±0    18±0    22±0
     31  199±0   208±0   203±0   202±0   200±0   197±0   208±0   195±0    20±0    23±0    21±0    22±0    22±0    19±0    22±0    18±0   209±0   218±0   209±0   213±0   210±0   207±0   212±0   206±0    21±0    23±0    21±0    22±0    22±0    19±0    21±0

    Min  latency: 17.0ns ±0.0 cores: (18,4)
    Max  latency: 235.5ns ±0.2 cores: (25,0)
    Mean latency: 117.3ns
ubergarm commented 2 months ago

output

ubergarm commented 1 month ago

The above previous result was on earlier AGESA 1.2.0.0a

Current results with new AGESA PI 1.2.0.2 are much better similar to #111 output-R9950X-AMD-AGESA-PI-1 2 0 2

MrMarvel commented 1 week ago

Why 32 cores in your results on 16-core processor? Or they are threads?

ubergarm commented 1 week ago

@MrMarvel

Yeah, psure it is because threads. I have simultaneous multithreading (SMT) enabled. Not sure why other folks graphs didn't show this. Either they disabled SMT or there is a CLI argument to use only CPUs 0-15 I'm guessing.