From db19672e601a5eae60f568452fa82226ffe4b8ae Mon Sep 17 00:00:00 2001 From: Jiannan Wang Date: Wed, 1 Apr 2026 14:56:40 -0700 Subject: [PATCH 1/2] Update SM100 BF16 benchmark figures for README Regenerate quack_suite (+LayerNorm) and dsv3_all SVGs with fresh benchmark data from GB200 (SM100). Using quack main and kernelagent main branch. --- .../sm100_bf16_oink_vs_quack_dsv3_all.svg | 570 +++++++++--------- ...m100_bf16_oink_vs_quack_with_layernorm.svg | 460 +++++++------- 2 files changed, 515 insertions(+), 515 deletions(-) diff --git a/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3_all.svg b/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3_all.svg index 9db31a50..d4c04fe1 100644 --- a/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3_all.svg +++ b/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3_all.svg @@ -6,7 +6,7 @@ - 2026-01-22T03:17:06.137573 + 2026-04-01T14:56:32.168445 image/svg+xml @@ -41,12 +41,12 @@ z - - + @@ -167,7 +167,7 @@ z - + @@ -204,7 +204,7 @@ z - + @@ -225,7 +225,7 @@ z - + @@ -257,7 +257,7 @@ z - + @@ -278,7 +278,7 @@ z - + @@ -299,7 +299,7 @@ z - + @@ -360,7 +360,7 @@ z - + @@ -381,7 +381,7 @@ z - + @@ -652,16 +652,16 @@ z +" clip-path="url(#p13029dc7c1)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - - + @@ -696,18 +696,18 @@ z - + - + - + - + - + - + @@ -764,18 +764,18 @@ L 432.752252 229.138044 - + - + - + @@ -1032,18 +1032,18 @@ z - + - - - - - - - - - - - + + + + + + + + + + - + - - - - - - - - - - - + + + + + + + + + + +" clip-path="url(#p13029dc7c1)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1307,7 +1307,7 @@ z - + @@ -1328,7 +1328,7 @@ z - + @@ -1349,7 +1349,7 @@ z - + @@ -1369,7 +1369,7 @@ z - + @@ -1390,7 +1390,7 @@ z - + @@ -1411,7 +1411,7 @@ z - + @@ -1431,7 +1431,7 @@ z - + @@ -1452,7 +1452,7 @@ z - + @@ -1500,101 +1500,101 @@ z +" clip-path="url(#p7650e4d191)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - - - - - - - - - - - + + + + + + + + + + + - - - - - - - - - - - + + + + + + + + + + + +" clip-path="url(#p7650e4d191)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1715,7 +1715,7 @@ z - + @@ -1736,7 +1736,7 @@ z - + @@ -1757,7 +1757,7 @@ z - + @@ -1777,7 +1777,7 @@ z - + @@ -1798,7 +1798,7 @@ z - + @@ -1819,7 +1819,7 @@ z - + @@ -1839,7 +1839,7 @@ z - + @@ -1860,7 +1860,7 @@ z - + @@ -1908,101 +1908,101 @@ z +" clip-path="url(#p1b3d9238e2)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - - - - - - - - - - - + + + + + + + + + + + - - - - - - - - - - - + + + + + + + + + + + +" clip-path="url(#p1b3d9238e2)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -2123,7 +2123,7 @@ z - + @@ -2144,7 +2144,7 @@ z - + @@ -2165,7 +2165,7 @@ z - + @@ -2185,7 +2185,7 @@ z - + @@ -2206,7 +2206,7 @@ z - + @@ -2227,7 +2227,7 @@ z - + @@ -2247,7 +2247,7 @@ z - + @@ -2268,7 +2268,7 @@ z - + @@ -2289,7 +2289,7 @@ z - + @@ -2310,7 +2310,7 @@ z - + @@ -2332,7 +2332,7 @@ z - + @@ -2433,113 +2433,113 @@ z +" clip-path="url(#p59290df043)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - - - - - - - - - - - - - - + + + + + + + + + + + + + + - - - - - - - - - - - - - - + + + + + + + + + + + + + + +" clip-path="url(#p59290df043)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -2857,7 +2857,7 @@ L 835.955625 46.691969 L 852.205625 46.691969 " style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - + @@ -2920,16 +2920,16 @@ z - + - + - + - + diff --git a/oink/benchmarks/media/sm100_bf16_oink_vs_quack_with_layernorm.svg b/oink/benchmarks/media/sm100_bf16_oink_vs_quack_with_layernorm.svg index 1780d62c..7e69c3b9 100644 --- a/oink/benchmarks/media/sm100_bf16_oink_vs_quack_with_layernorm.svg +++ b/oink/benchmarks/media/sm100_bf16_oink_vs_quack_with_layernorm.svg @@ -6,7 +6,7 @@ - 2026-01-22T03:16:59.406646 + 2026-04-01T14:56:31.598809 image/svg+xml @@ -41,12 +41,12 @@ z - - + @@ -176,7 +176,7 @@ z - + @@ -243,7 +243,7 @@ z - + @@ -322,7 +322,7 @@ z - + @@ -343,7 +343,7 @@ z - + @@ -365,7 +365,7 @@ z - + @@ -414,7 +414,7 @@ z - + @@ -439,16 +439,16 @@ z +" clip-path="url(#pa83e7dedad)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - - + @@ -483,18 +483,18 @@ z - + - + - + @@ -504,18 +504,18 @@ L 429.474812 286.38748 - + - + - + @@ -525,18 +525,18 @@ L 429.474812 238.228489 - + - + - + @@ -944,16 +944,16 @@ z - + - - - - - - - - - + + + + + + + + - + - - - - - - - - - + + + + + + + + +" clip-path="url(#pa83e7dedad)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1247,7 +1247,7 @@ z - + @@ -1268,7 +1268,7 @@ z - + @@ -1289,7 +1289,7 @@ z - + @@ -1310,7 +1310,7 @@ z - + @@ -1332,7 +1332,7 @@ z - + @@ -1354,7 +1354,7 @@ z - + @@ -1379,93 +1379,93 @@ z +" clip-path="url(#p291624cfe0)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - - - - - - - - - + + + + + + + + + - - - - - - - - - + + + + + + + + + +" clip-path="url(#p291624cfe0)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1601,7 +1601,7 @@ z - + @@ -1622,7 +1622,7 @@ z - + @@ -1643,7 +1643,7 @@ z - + @@ -1664,7 +1664,7 @@ z - + @@ -1686,7 +1686,7 @@ z - + @@ -1708,7 +1708,7 @@ z - + @@ -1733,93 +1733,93 @@ z +" clip-path="url(#pd8f750ee3e)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - - - - - - - - - + + + + + + + + + - - - - - - - - - + + + + + + + + + +" clip-path="url(#pd8f750ee3e)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1948,7 +1948,7 @@ z - + @@ -1969,7 +1969,7 @@ z - + @@ -1990,7 +1990,7 @@ z - + @@ -2011,7 +2011,7 @@ z - + @@ -2033,7 +2033,7 @@ z - + @@ -2055,7 +2055,7 @@ z - + @@ -2080,93 +2080,93 @@ z +" clip-path="url(#p4b311958f8)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - - - - - - - - - + + + + + + + + + - - - - - - - - - + + + + + + + + + +" clip-path="url(#p4b311958f8)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -2501,7 +2501,7 @@ L 835.955625 46.691969 L 852.205625 46.691969 " style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - + @@ -2564,16 +2564,16 @@ z - + - + - + - + From aafd6ff7bf8a2ba73be001e20c1e737aaec052ba Mon Sep 17 00:00:00 2001 From: Jiannan Wang Date: Wed, 1 Apr 2026 15:02:55 -0700 Subject: [PATCH 2/2] Update all SM100 BF16 and FP16 benchmark figures Regenerate all 12 SM100 SVGs (6 bf16 + 6 fp16) with fresh benchmark data from GB200 (SM100). Using quack main and kernelagent main branch. --- .../media/sm100_bf16_oink_vs_quack.svg | 350 +++++------ .../media/sm100_bf16_oink_vs_quack_dsv3.svg | 514 ++++++++-------- .../sm100_bf16_oink_vs_quack_dsv3_all.svg | 360 +++++------ ..._bf16_oink_vs_quack_dsv3_cross_entropy.svg | 180 +++--- ...bf16_oink_vs_quack_dsv3_with_layernorm.svg | 514 ++++++++-------- ...m100_bf16_oink_vs_quack_with_layernorm.svg | 294 ++++----- .../media/sm100_fp16_oink_vs_quack.svg | 350 +++++------ .../media/sm100_fp16_oink_vs_quack_dsv3.svg | 514 ++++++++-------- .../sm100_fp16_oink_vs_quack_dsv3_all.svg | 570 +++++++++--------- ..._fp16_oink_vs_quack_dsv3_cross_entropy.svg | 180 +++--- ...fp16_oink_vs_quack_dsv3_with_layernorm.svg | 514 ++++++++-------- ...m100_fp16_oink_vs_quack_with_layernorm.svg | 460 +++++++------- 12 files changed, 2400 insertions(+), 2400 deletions(-) diff --git a/oink/benchmarks/media/sm100_bf16_oink_vs_quack.svg b/oink/benchmarks/media/sm100_bf16_oink_vs_quack.svg index 96b5b83c..c389d152 100644 --- a/oink/benchmarks/media/sm100_bf16_oink_vs_quack.svg +++ b/oink/benchmarks/media/sm100_bf16_oink_vs_quack.svg @@ -6,7 +6,7 @@ - 2026-01-22T03:16:57.722815 + 2026-04-01T14:59:30.073052 image/svg+xml @@ -41,12 +41,12 @@ z - - + @@ -176,7 +176,7 @@ z - + @@ -243,7 +243,7 @@ z - + @@ -322,7 +322,7 @@ z - + @@ -343,7 +343,7 @@ z - + @@ -365,7 +365,7 @@ z - + @@ -414,7 +414,7 @@ z - + @@ -439,16 +439,16 @@ z +" clip-path="url(#pb4a365c86c)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - - + @@ -483,18 +483,18 @@ z - + - + - + @@ -504,18 +504,18 @@ L 424.416918 286.38748 - + - + - + @@ -525,18 +525,18 @@ L 424.416918 238.228489 - + - + - + @@ -944,16 +944,16 @@ z - + - - - - - - - - - + + + + + + + + - + - - - - - - - - - + + + + + + + + +" clip-path="url(#pb4a365c86c)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1247,7 +1247,7 @@ z - + @@ -1268,7 +1268,7 @@ z - + @@ -1289,7 +1289,7 @@ z - + @@ -1310,7 +1310,7 @@ z - + @@ -1332,7 +1332,7 @@ z - + @@ -1354,7 +1354,7 @@ z - + @@ -1379,93 +1379,93 @@ z +" clip-path="url(#pbf33add672)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - - - - - - - - - + + + + + + + + + - - - - - - - - - + + + + + + + + + +" clip-path="url(#pbf33add672)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1601,7 +1601,7 @@ z - + @@ -1622,7 +1622,7 @@ z - + @@ -1643,7 +1643,7 @@ z - + @@ -1664,7 +1664,7 @@ z - + @@ -1686,7 +1686,7 @@ z - + @@ -1708,7 +1708,7 @@ z - + @@ -1733,93 +1733,93 @@ z +" clip-path="url(#pe9ea1f9cc6)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - - - - - - - - - + + + + + + + + + - - - - - - - - - + + + + + + + + + +" clip-path="url(#pe9ea1f9cc6)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -2183,7 +2183,7 @@ L 619.955625 46.691969 L 636.205625 46.691969 " style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - + @@ -2246,13 +2246,13 @@ z - + - + - + diff --git a/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3.svg b/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3.svg index 254623e1..225cda84 100644 --- a/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3.svg +++ b/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3.svg @@ -6,7 +6,7 @@ - 2026-01-22T03:17:01.077305 + 2026-04-01T14:59:31.131866 image/svg+xml @@ -41,12 +41,12 @@ z - - + @@ -167,7 +167,7 @@ z - + @@ -204,7 +204,7 @@ z - + @@ -225,7 +225,7 @@ z - + @@ -257,7 +257,7 @@ z - + @@ -278,7 +278,7 @@ z - + @@ -299,7 +299,7 @@ z - + @@ -360,7 +360,7 @@ z - + @@ -381,7 +381,7 @@ z - + @@ -405,16 +405,16 @@ z +" clip-path="url(#p8c321742c8)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - - + @@ -449,18 +449,18 @@ z - + - + - + @@ -470,18 +470,18 @@ L 428.808051 314.300811 - + - + - + - + - + - + - + - + - + @@ -593,18 +593,18 @@ L 428.808051 240.390434 - + - + - + - + - + - + @@ -662,18 +662,18 @@ L 428.808051 191.116848 - + - + - + @@ -1081,18 +1081,18 @@ z - + - - - - - - - - - - - + + + + + + + + + + - + - - - - - - - - - - - + + + + + + + + + + +" clip-path="url(#p8c321742c8)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1400,7 +1400,7 @@ z - + @@ -1421,7 +1421,7 @@ z - + @@ -1442,7 +1442,7 @@ z - + @@ -1462,7 +1462,7 @@ z - + @@ -1483,7 +1483,7 @@ z - + @@ -1504,7 +1504,7 @@ z - + @@ -1524,7 +1524,7 @@ z - + @@ -1545,7 +1545,7 @@ z - + @@ -1569,149 +1569,149 @@ z +" clip-path="url(#pcf1e632d21)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - - - - - - - - - - - + + + + + + + + + + + - - - - - - - - - - - + + + + + + + + + + + +" clip-path="url(#pcf1e632d21)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1832,7 +1832,7 @@ z - + @@ -1853,7 +1853,7 @@ z - + @@ -1874,7 +1874,7 @@ z - + @@ -1894,7 +1894,7 @@ z - + @@ -1915,7 +1915,7 @@ z - + @@ -1936,7 +1936,7 @@ z - + @@ -1956,7 +1956,7 @@ z - + @@ -1977,7 +1977,7 @@ z - + @@ -2001,149 +2001,149 @@ z +" clip-path="url(#p6563de3a8a)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - - - - - - - - - - - + + + + + + + + + + + - - - - - - - - - - - + + + + + + + + + + + +" clip-path="url(#p6563de3a8a)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -2524,7 +2524,7 @@ L 619.955625 46.691969 L 636.205625 46.691969 " style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - + @@ -2587,13 +2587,13 @@ z - + - + - + diff --git a/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3_all.svg b/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3_all.svg index d4c04fe1..bb02c6af 100644 --- a/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3_all.svg +++ b/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3_all.svg @@ -6,7 +6,7 @@ - 2026-04-01T14:56:32.168445 + 2026-04-01T14:59:32.230116 image/svg+xml @@ -41,12 +41,12 @@ z - - + @@ -167,7 +167,7 @@ z - + @@ -204,7 +204,7 @@ z - + @@ -225,7 +225,7 @@ z - + @@ -257,7 +257,7 @@ z - + @@ -278,7 +278,7 @@ z - + @@ -299,7 +299,7 @@ z - + @@ -360,7 +360,7 @@ z - + @@ -381,7 +381,7 @@ z - + @@ -652,16 +652,16 @@ z +" clip-path="url(#p698f0e11ab)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - - + @@ -698,11 +698,11 @@ z +" clip-path="url(#p698f0e11ab)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -745,11 +745,11 @@ z +" clip-path="url(#p698f0e11ab)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -766,11 +766,11 @@ L 432.752252 225.167442 +" clip-path="url(#p698f0e11ab)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1041,9 +1041,9 @@ L 288.141268 159.113448 L 330.673911 187.236566 L 373.206553 165.497622 L 415.739195 158.127923 -" clip-path="url(#p13029dc7c1)" style="fill: none; stroke: #5ba3f5; stroke-width: 5; stroke-linecap: square"/> +" clip-path="url(#p698f0e11ab)" style="fill: none; stroke: #5ba3f5; stroke-width: 5; stroke-linecap: square"/> - - - - - - - - - - - + + + + + + + + + + @@ -1077,9 +1077,9 @@ L 288.141268 238.715449 L 330.673911 253.290043 L 373.206553 241.917422 L 415.739195 239.96893 -" clip-path="url(#p13029dc7c1)" style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> +" clip-path="url(#p698f0e11ab)" style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - - - - - - - - - - - + + + + + + + + + + +" clip-path="url(#p698f0e11ab)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1307,7 +1307,7 @@ z - + @@ -1328,7 +1328,7 @@ z - + @@ -1349,7 +1349,7 @@ z - + @@ -1369,7 +1369,7 @@ z - + @@ -1390,7 +1390,7 @@ z - + @@ -1411,7 +1411,7 @@ z - + @@ -1431,7 +1431,7 @@ z - + @@ -1452,7 +1452,7 @@ z - + @@ -1500,11 +1500,11 @@ z +" clip-path="url(#p3e5c7a9d8b)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1512,11 +1512,11 @@ L 847.881059 316.082831 +" clip-path="url(#p3e5c7a9d8b)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1524,11 +1524,11 @@ L 847.881059 270.625136 +" clip-path="url(#p3e5c7a9d8b)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1536,11 +1536,11 @@ L 847.881059 225.167442 +" clip-path="url(#p3e5c7a9d8b)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1555,17 +1555,17 @@ L 703.270075 165.624023 L 745.802717 207.997519 L 788.33536 184.686067 L 830.868002 183.507584 -" clip-path="url(#p7650e4d191)" style="fill: none; stroke: #5ba3f5; stroke-width: 5; stroke-linecap: square"/> - - - - - - - - - - +" clip-path="url(#p3e5c7a9d8b)" style="fill: none; stroke: #5ba3f5; stroke-width: 5; stroke-linecap: square"/> + + + + + + + + + + @@ -1578,23 +1578,23 @@ L 703.270075 219.412714 L 745.802717 249.869294 L 788.33536 225.431781 L 830.868002 219.148144 -" clip-path="url(#p7650e4d191)" style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - - - - - - - - - - +" clip-path="url(#p3e5c7a9d8b)" style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> + + + + + + + + + + +" clip-path="url(#p3e5c7a9d8b)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1715,7 +1715,7 @@ z - + @@ -1736,7 +1736,7 @@ z - + @@ -1757,7 +1757,7 @@ z - + @@ -1777,7 +1777,7 @@ z - + @@ -1798,7 +1798,7 @@ z - + @@ -1819,7 +1819,7 @@ z - + @@ -1839,7 +1839,7 @@ z - + @@ -1860,7 +1860,7 @@ z - + @@ -1908,11 +1908,11 @@ z +" clip-path="url(#p119880813e)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1920,11 +1920,11 @@ L 1263.009866 316.082831 +" clip-path="url(#p119880813e)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1932,11 +1932,11 @@ L 1263.009866 270.625136 +" clip-path="url(#p119880813e)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1944,11 +1944,11 @@ L 1263.009866 225.167442 +" clip-path="url(#p119880813e)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1963,17 +1963,17 @@ L 1118.398882 164.919554 L 1160.931524 218.487524 L 1203.464166 177.47494 L 1245.996809 171.105306 -" clip-path="url(#p1b3d9238e2)" style="fill: none; stroke: #5ba3f5; stroke-width: 5; stroke-linecap: square"/> - - - - - - - - - - +" clip-path="url(#p119880813e)" style="fill: none; stroke: #5ba3f5; stroke-width: 5; stroke-linecap: square"/> + + + + + + + + + + @@ -1986,23 +1986,23 @@ L 1118.398882 189.380002 L 1160.931524 226.597197 L 1203.464166 200.598295 L 1245.996809 194.458907 -" clip-path="url(#p1b3d9238e2)" style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - - - - - - - - - - +" clip-path="url(#p119880813e)" style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> + + + + + + + + + + +" clip-path="url(#p119880813e)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -2123,7 +2123,7 @@ z - + @@ -2144,7 +2144,7 @@ z - + @@ -2165,7 +2165,7 @@ z - + @@ -2185,7 +2185,7 @@ z - + @@ -2206,7 +2206,7 @@ z - + @@ -2227,7 +2227,7 @@ z - + @@ -2247,7 +2247,7 @@ z - + @@ -2268,7 +2268,7 @@ z - + @@ -2289,7 +2289,7 @@ z - + @@ -2310,7 +2310,7 @@ z - + @@ -2332,7 +2332,7 @@ z - + @@ -2433,11 +2433,11 @@ z +" clip-path="url(#p73bc4c6785)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -2445,11 +2445,11 @@ L 1678.138672 316.082831 +" clip-path="url(#p73bc4c6785)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -2457,11 +2457,11 @@ L 1678.138672 270.625136 +" clip-path="url(#p73bc4c6785)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -2469,11 +2469,11 @@ L 1678.138672 225.167442 +" clip-path="url(#p73bc4c6785)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -2491,20 +2491,20 @@ L 1568.327123 184.91125 L 1599.259954 211.776562 L 1630.192785 187.477755 L 1661.125616 190.017723 -" clip-path="url(#p59290df043)" style="fill: none; stroke: #5ba3f5; stroke-width: 5; stroke-linecap: square"/> - - - - - - - - - - - - - +" clip-path="url(#p73bc4c6785)" style="fill: none; stroke: #5ba3f5; stroke-width: 5; stroke-linecap: square"/> + + + + + + + + + + + + + @@ -2520,26 +2520,26 @@ L 1568.327123 220.531495 L 1599.259954 270.451166 L 1630.192785 228.956803 L 1661.125616 227.469037 -" clip-path="url(#p59290df043)" style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - - - - - - - - - - - - - +" clip-path="url(#p73bc4c6785)" style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> + + + + + + + + + + + + + +" clip-path="url(#p73bc4c6785)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -2857,7 +2857,7 @@ L 835.955625 46.691969 L 852.205625 46.691969 " style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - + @@ -2920,16 +2920,16 @@ z - + - + - + - + diff --git a/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3_cross_entropy.svg b/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3_cross_entropy.svg index c3929594..8bf5aba8 100644 --- a/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3_cross_entropy.svg +++ b/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3_cross_entropy.svg @@ -6,7 +6,7 @@ - 2026-01-22T03:17:04.456371 + 2026-04-01T14:59:32.708063 image/svg+xml @@ -41,12 +41,12 @@ z - - + @@ -169,7 +169,7 @@ z - + @@ -236,7 +236,7 @@ z - + @@ -257,7 +257,7 @@ z - + @@ -277,7 +277,7 @@ z - + @@ -298,7 +298,7 @@ z - + @@ -319,7 +319,7 @@ z - + @@ -380,7 +380,7 @@ z - + @@ -401,7 +401,7 @@ z - + @@ -422,7 +422,7 @@ z - + @@ -469,7 +469,7 @@ z - + @@ -491,7 +491,7 @@ z - + @@ -516,16 +516,16 @@ z +" clip-path="url(#p17040c73d4)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - - + @@ -560,18 +560,18 @@ z - + - + - + @@ -581,18 +581,18 @@ L 384.123653 286.339994 - + - + - + @@ -602,18 +602,18 @@ L 384.123653 238.197157 - + - + - + @@ -1021,21 +1021,21 @@ z - + - - - - - - - - - - - - - - + + + + + + + + + + + + + - + - - - - - - - - - - - - - - + + + + + + + + + + + + + +" clip-path="url(#p17040c73d4)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1568,7 +1568,7 @@ L 130.874375 62.995875 L 145.874375 62.995875 " style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - + @@ -1680,7 +1680,7 @@ z - + diff --git a/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3_with_layernorm.svg b/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3_with_layernorm.svg index 0d4c1aeb..7b565775 100644 --- a/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3_with_layernorm.svg +++ b/oink/benchmarks/media/sm100_bf16_oink_vs_quack_dsv3_with_layernorm.svg @@ -6,7 +6,7 @@ - 2026-01-22T03:17:02.768056 + 2026-04-01T14:59:31.659973 image/svg+xml @@ -41,12 +41,12 @@ z - - + @@ -167,7 +167,7 @@ z - + @@ -204,7 +204,7 @@ z - + @@ -225,7 +225,7 @@ z - + @@ -257,7 +257,7 @@ z - + @@ -278,7 +278,7 @@ z - + @@ -299,7 +299,7 @@ z - + @@ -360,7 +360,7 @@ z - + @@ -381,7 +381,7 @@ z - + @@ -405,16 +405,16 @@ z +" clip-path="url(#pf7ab9d67bc)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - - + @@ -449,18 +449,18 @@ z - + - + - + @@ -470,18 +470,18 @@ L 428.808051 314.300811 - + - + - + - + - + - + - + - + - + @@ -593,18 +593,18 @@ L 428.808051 240.390434 - + - + - + - + - + - + @@ -662,18 +662,18 @@ L 428.808051 191.116848 - + - + - + @@ -1081,18 +1081,18 @@ z - + - - - - - - - - - - - + + + + + + + + + + - + - - - - - - - - - - - + + + + + + + + + + +" clip-path="url(#pf7ab9d67bc)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1400,7 +1400,7 @@ z - + @@ -1421,7 +1421,7 @@ z - + @@ -1442,7 +1442,7 @@ z - + @@ -1462,7 +1462,7 @@ z - + @@ -1483,7 +1483,7 @@ z - + @@ -1504,7 +1504,7 @@ z - + @@ -1524,7 +1524,7 @@ z - + @@ -1545,7 +1545,7 @@ z - + @@ -1569,149 +1569,149 @@ z +" clip-path="url(#p595ae33466)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - - - - - - - - - - - + + + + + + + + + + + - - - - - - - - - - - + + + + + + + + + + + +" clip-path="url(#p595ae33466)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1832,7 +1832,7 @@ z - + @@ -1853,7 +1853,7 @@ z - + @@ -1874,7 +1874,7 @@ z - + @@ -1894,7 +1894,7 @@ z - + @@ -1915,7 +1915,7 @@ z - + @@ -1936,7 +1936,7 @@ z - + @@ -1956,7 +1956,7 @@ z - + @@ -1977,7 +1977,7 @@ z - + @@ -2001,149 +2001,149 @@ z +" clip-path="url(#p6c2874718d)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - - - - - - - - - - - + + + + + + + + + + + - - - - - - - - - - - + + + + + + + + + + + +" clip-path="url(#p6c2874718d)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -2524,7 +2524,7 @@ L 619.955625 46.691969 L 636.205625 46.691969 " style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - + @@ -2587,13 +2587,13 @@ z - + - + - + diff --git a/oink/benchmarks/media/sm100_bf16_oink_vs_quack_with_layernorm.svg b/oink/benchmarks/media/sm100_bf16_oink_vs_quack_with_layernorm.svg index 7e69c3b9..a9d95c6a 100644 --- a/oink/benchmarks/media/sm100_bf16_oink_vs_quack_with_layernorm.svg +++ b/oink/benchmarks/media/sm100_bf16_oink_vs_quack_with_layernorm.svg @@ -6,7 +6,7 @@ - 2026-04-01T14:56:31.598809 + 2026-04-01T14:59:30.611120 image/svg+xml @@ -41,12 +41,12 @@ z - - + @@ -176,7 +176,7 @@ z - + @@ -243,7 +243,7 @@ z - + @@ -322,7 +322,7 @@ z - + @@ -343,7 +343,7 @@ z - + @@ -365,7 +365,7 @@ z - + @@ -414,7 +414,7 @@ z - + @@ -439,16 +439,16 @@ z +" clip-path="url(#pbe59b49cbc)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - - + @@ -485,11 +485,11 @@ z +" clip-path="url(#pbe59b49cbc)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -506,11 +506,11 @@ L 429.474812 284.188151 +" clip-path="url(#pbe59b49cbc)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -527,11 +527,11 @@ L 429.474812 233.829831 +" clip-path="url(#pbe59b49cbc)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -951,9 +951,9 @@ L 243.969906 167.716557 L 300.183514 166.02933 L 356.397122 166.438596 L 412.61073 163.981061 -" clip-path="url(#pa83e7dedad)" style="fill: none; stroke: #5ba3f5; stroke-width: 5; stroke-linecap: square"/> +" clip-path="url(#pbe59b49cbc)" style="fill: none; stroke: #5ba3f5; stroke-width: 5; stroke-linecap: square"/> - - - - - - - - - + + + + + + + + @@ -983,9 +983,9 @@ L 243.969906 187.082251 L 300.183514 187.763561 L 356.397122 187.758255 L 412.61073 190.263482 -" clip-path="url(#pa83e7dedad)" style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> +" clip-path="url(#pbe59b49cbc)" style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - - - - - - - - - + + + + + + + + +" clip-path="url(#pbe59b49cbc)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1247,7 +1247,7 @@ z - + @@ -1268,7 +1268,7 @@ z - + @@ -1289,7 +1289,7 @@ z - + @@ -1310,7 +1310,7 @@ z - + @@ -1332,7 +1332,7 @@ z - + @@ -1354,7 +1354,7 @@ z - + @@ -1379,11 +1379,11 @@ z +" clip-path="url(#pd153ac6e28)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1391,11 +1391,11 @@ L 845.717312 334.546471 +" clip-path="url(#pd153ac6e28)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1403,11 +1403,11 @@ L 845.717312 284.188151 +" clip-path="url(#pd153ac6e28)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1415,11 +1415,11 @@ L 845.717312 233.829831 +" clip-path="url(#pd153ac6e28)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1432,15 +1432,15 @@ L 660.212406 164.704412 L 716.426014 172.872721 L 772.639622 164.54641 L 828.85323 170.241154 -" clip-path="url(#p291624cfe0)" style="fill: none; stroke: #5ba3f5; stroke-width: 5; stroke-linecap: square"/> - - - - - - - - +" clip-path="url(#pd153ac6e28)" style="fill: none; stroke: #5ba3f5; stroke-width: 5; stroke-linecap: square"/> + + + + + + + + @@ -1451,21 +1451,21 @@ L 660.212406 232.609086 L 716.426014 234.145261 L 772.639622 233.171621 L 828.85323 233.447426 -" clip-path="url(#p291624cfe0)" style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - - - - - - - - +" clip-path="url(#pd153ac6e28)" style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> + + + + + + + + +" clip-path="url(#pd153ac6e28)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1601,7 +1601,7 @@ z - + @@ -1622,7 +1622,7 @@ z - + @@ -1643,7 +1643,7 @@ z - + @@ -1664,7 +1664,7 @@ z - + @@ -1686,7 +1686,7 @@ z - + @@ -1708,7 +1708,7 @@ z - + @@ -1733,11 +1733,11 @@ z +" clip-path="url(#pf162b46d8c)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1745,11 +1745,11 @@ L 1261.959812 334.546471 +" clip-path="url(#pf162b46d8c)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1757,11 +1757,11 @@ L 1261.959812 284.188151 +" clip-path="url(#pf162b46d8c)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1769,11 +1769,11 @@ L 1261.959812 233.829831 +" clip-path="url(#pf162b46d8c)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -1786,15 +1786,15 @@ L 1076.454906 182.971718 L 1132.668514 182.600538 L 1188.882122 181.19129 L 1245.09573 183.69519 -" clip-path="url(#pd8f750ee3e)" style="fill: none; stroke: #5ba3f5; stroke-width: 5; stroke-linecap: square"/> - - - - - - - - +" clip-path="url(#pf162b46d8c)" style="fill: none; stroke: #5ba3f5; stroke-width: 5; stroke-linecap: square"/> + + + + + + + + @@ -1805,21 +1805,21 @@ L 1076.454906 234.579486 L 1132.668514 232.618701 L 1188.882122 234.425119 L 1245.09573 236.231734 -" clip-path="url(#pd8f750ee3e)" style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - - - - - - - - +" clip-path="url(#pf162b46d8c)" style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> + + + + + + + + +" clip-path="url(#pf162b46d8c)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1948,7 +1948,7 @@ z - + @@ -1969,7 +1969,7 @@ z - + @@ -1990,7 +1990,7 @@ z - + @@ -2011,7 +2011,7 @@ z - + @@ -2033,7 +2033,7 @@ z - + @@ -2055,7 +2055,7 @@ z - + @@ -2080,11 +2080,11 @@ z +" clip-path="url(#pc73f922692)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -2092,11 +2092,11 @@ L 1678.202312 334.546471 +" clip-path="url(#pc73f922692)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -2104,11 +2104,11 @@ L 1678.202312 284.188151 +" clip-path="url(#pc73f922692)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -2116,11 +2116,11 @@ L 1678.202312 233.829831 +" clip-path="url(#pc73f922692)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + @@ -2133,15 +2133,15 @@ L 1492.697406 172.193479 L 1548.911014 173.492268 L 1605.124622 172.922717 L 1661.33823 170.989327 -" clip-path="url(#p4b311958f8)" style="fill: none; stroke: #5ba3f5; stroke-width: 5; stroke-linecap: square"/> - - - - - - - - +" clip-path="url(#pc73f922692)" style="fill: none; stroke: #5ba3f5; stroke-width: 5; stroke-linecap: square"/> + + + + + + + + @@ -2152,21 +2152,21 @@ L 1492.697406 199.71653 L 1548.911014 204.591522 L 1605.124622 208.707572 L 1661.33823 204.083872 -" clip-path="url(#p4b311958f8)" style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - - - - - - - - +" clip-path="url(#pc73f922692)" style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> + + + + + + + + +" clip-path="url(#pc73f922692)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -2501,7 +2501,7 @@ L 835.955625 46.691969 L 852.205625 46.691969 " style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - + @@ -2564,16 +2564,16 @@ z - + - + - + - + diff --git a/oink/benchmarks/media/sm100_fp16_oink_vs_quack.svg b/oink/benchmarks/media/sm100_fp16_oink_vs_quack.svg index e3bcd468..fb86c4c1 100644 --- a/oink/benchmarks/media/sm100_fp16_oink_vs_quack.svg +++ b/oink/benchmarks/media/sm100_fp16_oink_vs_quack.svg @@ -6,7 +6,7 @@ - 2026-01-22T03:17:07.801333 + 2026-04-01T15:02:44.828906 image/svg+xml @@ -41,12 +41,12 @@ z - - + @@ -176,7 +176,7 @@ z - + @@ -243,7 +243,7 @@ z - + @@ -322,7 +322,7 @@ z - + @@ -343,7 +343,7 @@ z - + @@ -365,7 +365,7 @@ z - + @@ -414,7 +414,7 @@ z - + @@ -439,16 +439,16 @@ z +" clip-path="url(#p453b4b1d0c)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - - + @@ -483,18 +483,18 @@ z - + - + - + @@ -504,18 +504,18 @@ L 424.416918 286.389791 - + - + - + @@ -525,18 +525,18 @@ L 424.416918 238.23311 - + - + - + @@ -944,16 +944,16 @@ z - + - - - - - - - - - + + + + + + + + - + - - - - - - - - - + + + + + + + + +" clip-path="url(#p453b4b1d0c)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1247,7 +1247,7 @@ z - + @@ -1268,7 +1268,7 @@ z - + @@ -1289,7 +1289,7 @@ z - + @@ -1310,7 +1310,7 @@ z - + @@ -1332,7 +1332,7 @@ z - + @@ -1354,7 +1354,7 @@ z - + @@ -1379,93 +1379,93 @@ z +" clip-path="url(#pe5e46a0357)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - - - - - - - - - + + + + + + + + + - - - - - - - - - + + + + + + + + + +" clip-path="url(#pe5e46a0357)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1601,7 +1601,7 @@ z - + @@ -1622,7 +1622,7 @@ z - + @@ -1643,7 +1643,7 @@ z - + @@ -1664,7 +1664,7 @@ z - + @@ -1686,7 +1686,7 @@ z - + @@ -1708,7 +1708,7 @@ z - + @@ -1733,93 +1733,93 @@ z +" clip-path="url(#p1904335f5f)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - - - - - - - - - + + + + + + + + + - - - - - - - - - + + + + + + + + + +" clip-path="url(#p1904335f5f)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -2204,7 +2204,7 @@ L 619.955625 46.691969 L 636.205625 46.691969 " style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - + @@ -2267,13 +2267,13 @@ z - + - + - + diff --git a/oink/benchmarks/media/sm100_fp16_oink_vs_quack_dsv3.svg b/oink/benchmarks/media/sm100_fp16_oink_vs_quack_dsv3.svg index e5cecac9..a81150ff 100644 --- a/oink/benchmarks/media/sm100_fp16_oink_vs_quack_dsv3.svg +++ b/oink/benchmarks/media/sm100_fp16_oink_vs_quack_dsv3.svg @@ -6,7 +6,7 @@ - 2026-01-22T03:17:11.211653 + 2026-04-01T15:02:45.916517 image/svg+xml @@ -41,12 +41,12 @@ z - - + @@ -167,7 +167,7 @@ z - + @@ -204,7 +204,7 @@ z - + @@ -225,7 +225,7 @@ z - + @@ -257,7 +257,7 @@ z - + @@ -278,7 +278,7 @@ z - + @@ -299,7 +299,7 @@ z - + @@ -360,7 +360,7 @@ z - + @@ -381,7 +381,7 @@ z - + @@ -405,16 +405,16 @@ z +" clip-path="url(#p3bdfd22bba)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - - + @@ -449,18 +449,18 @@ z - + - + - + @@ -470,18 +470,18 @@ L 428.808051 314.301993 - + - + - + - + - + - + - + - + - + @@ -593,18 +593,18 @@ L 428.808051 240.395161 - + - + - + - + - + - + @@ -662,18 +662,18 @@ L 428.808051 191.12394 - + - + - + @@ -1081,18 +1081,18 @@ z - + - - - - - - - - - - - + + + + + + + + + + - + - - - - - - - - - - - + + + + + + + + + + +" clip-path="url(#p3bdfd22bba)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1400,7 +1400,7 @@ z - + @@ -1421,7 +1421,7 @@ z - + @@ -1442,7 +1442,7 @@ z - + @@ -1462,7 +1462,7 @@ z - + @@ -1483,7 +1483,7 @@ z - + @@ -1504,7 +1504,7 @@ z - + @@ -1524,7 +1524,7 @@ z - + @@ -1545,7 +1545,7 @@ z - + @@ -1569,149 +1569,149 @@ z +" clip-path="url(#p09aa47719b)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - - - - - - - - - - - + + + + + + + + + + + - - - - - - - - - - - + + + + + + + + + + + +" clip-path="url(#p09aa47719b)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1832,7 +1832,7 @@ z - + @@ -1853,7 +1853,7 @@ z - + @@ -1874,7 +1874,7 @@ z - + @@ -1894,7 +1894,7 @@ z - + @@ -1915,7 +1915,7 @@ z - + @@ -1936,7 +1936,7 @@ z - + @@ -1956,7 +1956,7 @@ z - + @@ -1977,7 +1977,7 @@ z - + @@ -2001,149 +2001,149 @@ z +" clip-path="url(#p90837d238b)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - - - - - - - - - - - + + + + + + + + + + + - - - - - - - - - - - + + + + + + + + + + + +" clip-path="url(#p90837d238b)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -2545,7 +2545,7 @@ L 619.955625 46.691969 L 636.205625 46.691969 " style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - + @@ -2608,13 +2608,13 @@ z - + - + - + diff --git a/oink/benchmarks/media/sm100_fp16_oink_vs_quack_dsv3_all.svg b/oink/benchmarks/media/sm100_fp16_oink_vs_quack_dsv3_all.svg index 15759064..5dba9c86 100644 --- a/oink/benchmarks/media/sm100_fp16_oink_vs_quack_dsv3_all.svg +++ b/oink/benchmarks/media/sm100_fp16_oink_vs_quack_dsv3_all.svg @@ -6,7 +6,7 @@ - 2026-01-22T03:17:16.168483 + 2026-04-01T15:02:47.071878 image/svg+xml @@ -41,12 +41,12 @@ z - - + @@ -167,7 +167,7 @@ z - + @@ -204,7 +204,7 @@ z - + @@ -225,7 +225,7 @@ z - + @@ -257,7 +257,7 @@ z - + @@ -278,7 +278,7 @@ z - + @@ -299,7 +299,7 @@ z - + @@ -360,7 +360,7 @@ z - + @@ -381,7 +381,7 @@ z - + @@ -652,16 +652,16 @@ z +" clip-path="url(#p2e56732894)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - - + @@ -696,18 +696,18 @@ z - + - + - + - + - + - + @@ -764,18 +764,18 @@ L 432.752252 229.142215 - + - + - + @@ -1032,18 +1032,18 @@ z - + - - - - - - - - - - - + + + + + + + + + + - + - - - - - - - - - - - + + + + + + + + + + +" clip-path="url(#p2e56732894)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1307,7 +1307,7 @@ z - + @@ -1328,7 +1328,7 @@ z - + @@ -1349,7 +1349,7 @@ z - + @@ -1369,7 +1369,7 @@ z - + @@ -1390,7 +1390,7 @@ z - + @@ -1411,7 +1411,7 @@ z - + @@ -1431,7 +1431,7 @@ z - + @@ -1452,7 +1452,7 @@ z - + @@ -1500,101 +1500,101 @@ z +" clip-path="url(#p4c5ec45a8d)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - - - - - - - - - - - + + + + + + + + + + + - - - - - - - - - - - + + + + + + + + + + + +" clip-path="url(#p4c5ec45a8d)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1715,7 +1715,7 @@ z - + @@ -1736,7 +1736,7 @@ z - + @@ -1757,7 +1757,7 @@ z - + @@ -1777,7 +1777,7 @@ z - + @@ -1798,7 +1798,7 @@ z - + @@ -1819,7 +1819,7 @@ z - + @@ -1839,7 +1839,7 @@ z - + @@ -1860,7 +1860,7 @@ z - + @@ -1908,101 +1908,101 @@ z +" clip-path="url(#pddd6b6e490)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - - - - - - - - - - - + + + + + + + + + + + - - - - - - - - - - - + + + + + + + + + + + +" clip-path="url(#pddd6b6e490)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -2123,7 +2123,7 @@ z - + @@ -2144,7 +2144,7 @@ z - + @@ -2165,7 +2165,7 @@ z - + @@ -2185,7 +2185,7 @@ z - + @@ -2206,7 +2206,7 @@ z - + @@ -2227,7 +2227,7 @@ z - + @@ -2247,7 +2247,7 @@ z - + @@ -2268,7 +2268,7 @@ z - + @@ -2289,7 +2289,7 @@ z - + @@ -2310,7 +2310,7 @@ z - + @@ -2332,7 +2332,7 @@ z - + @@ -2433,113 +2433,113 @@ z +" clip-path="url(#p0cc11db47e)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - - - - - - - - - - - - - - + + + + + + + + + + + + + + - - - - - - - - - - - - - - + + + + + + + + + + + + + + +" clip-path="url(#p0cc11db47e)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -2878,7 +2878,7 @@ L 835.955625 46.691969 L 852.205625 46.691969 " style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - + @@ -2941,16 +2941,16 @@ z - + - + - + - + diff --git a/oink/benchmarks/media/sm100_fp16_oink_vs_quack_dsv3_cross_entropy.svg b/oink/benchmarks/media/sm100_fp16_oink_vs_quack_dsv3_cross_entropy.svg index 66a30753..061c0f5f 100644 --- a/oink/benchmarks/media/sm100_fp16_oink_vs_quack_dsv3_cross_entropy.svg +++ b/oink/benchmarks/media/sm100_fp16_oink_vs_quack_dsv3_cross_entropy.svg @@ -6,7 +6,7 @@ - 2026-01-22T03:17:14.531728 + 2026-04-01T15:02:47.543617 image/svg+xml @@ -41,12 +41,12 @@ z - - + @@ -169,7 +169,7 @@ z - + @@ -236,7 +236,7 @@ z - + @@ -257,7 +257,7 @@ z - + @@ -277,7 +277,7 @@ z - + @@ -298,7 +298,7 @@ z - + @@ -319,7 +319,7 @@ z - + @@ -380,7 +380,7 @@ z - + @@ -401,7 +401,7 @@ z - + @@ -422,7 +422,7 @@ z - + @@ -469,7 +469,7 @@ z - + @@ -491,7 +491,7 @@ z - + @@ -516,16 +516,16 @@ z +" clip-path="url(#pe6624a06c2)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - - + @@ -560,18 +560,18 @@ z - + - + - + @@ -581,18 +581,18 @@ L 384.123653 286.342304 - + - + - + @@ -602,18 +602,18 @@ L 384.123653 238.201776 - + - + - + @@ -1021,21 +1021,21 @@ z - + - - - - - - - - - - - - - - + + + + + + + + + + + + + - + - - - - - - - - - - - - - - + + + + + + + + + + + + + +" clip-path="url(#pe6624a06c2)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1589,7 +1589,7 @@ L 130.874375 62.995875 L 145.874375 62.995875 " style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - + @@ -1701,7 +1701,7 @@ z - + diff --git a/oink/benchmarks/media/sm100_fp16_oink_vs_quack_dsv3_with_layernorm.svg b/oink/benchmarks/media/sm100_fp16_oink_vs_quack_dsv3_with_layernorm.svg index d87b7b94..747d3416 100644 --- a/oink/benchmarks/media/sm100_fp16_oink_vs_quack_dsv3_with_layernorm.svg +++ b/oink/benchmarks/media/sm100_fp16_oink_vs_quack_dsv3_with_layernorm.svg @@ -6,7 +6,7 @@ - 2026-01-22T03:17:12.903096 + 2026-04-01T15:02:46.483067 image/svg+xml @@ -41,12 +41,12 @@ z - - + @@ -167,7 +167,7 @@ z - + @@ -204,7 +204,7 @@ z - + @@ -225,7 +225,7 @@ z - + @@ -257,7 +257,7 @@ z - + @@ -278,7 +278,7 @@ z - + @@ -299,7 +299,7 @@ z - + @@ -360,7 +360,7 @@ z - + @@ -381,7 +381,7 @@ z - + @@ -405,16 +405,16 @@ z +" clip-path="url(#p669427bcab)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - - + @@ -449,18 +449,18 @@ z - + - + - + @@ -470,18 +470,18 @@ L 428.808051 314.301993 - + - + - + - + - + - + - + - + - + @@ -593,18 +593,18 @@ L 428.808051 240.395161 - + - + - + - + - + - + @@ -662,18 +662,18 @@ L 428.808051 191.12394 - + - + - + @@ -1081,18 +1081,18 @@ z - + - - - - - - - - - - - + + + + + + + + + + - + - - - - - - - - - - - + + + + + + + + + + +" clip-path="url(#p669427bcab)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1400,7 +1400,7 @@ z - + @@ -1421,7 +1421,7 @@ z - + @@ -1442,7 +1442,7 @@ z - + @@ -1462,7 +1462,7 @@ z - + @@ -1483,7 +1483,7 @@ z - + @@ -1504,7 +1504,7 @@ z - + @@ -1524,7 +1524,7 @@ z - + @@ -1545,7 +1545,7 @@ z - + @@ -1569,149 +1569,149 @@ z +" clip-path="url(#p6bce9f7de8)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - - - - - - - - - - - + + + + + + + + + + + - - - - - - - - - - - + + + + + + + + + + + +" clip-path="url(#p6bce9f7de8)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1832,7 +1832,7 @@ z - + @@ -1853,7 +1853,7 @@ z - + @@ -1874,7 +1874,7 @@ z - + @@ -1894,7 +1894,7 @@ z - + @@ -1915,7 +1915,7 @@ z - + @@ -1936,7 +1936,7 @@ z - + @@ -1956,7 +1956,7 @@ z - + @@ -1977,7 +1977,7 @@ z - + @@ -2001,149 +2001,149 @@ z +" clip-path="url(#peb0cb722bf)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - + - + - + - + - + - + - + - + - - - - - - - - - - - + + + + + + + + + + + - - - - - - - - - - - + + + + + + + + + + + +" clip-path="url(#peb0cb722bf)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -2545,7 +2545,7 @@ L 619.955625 46.691969 L 636.205625 46.691969 " style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - + @@ -2608,13 +2608,13 @@ z - + - + - + diff --git a/oink/benchmarks/media/sm100_fp16_oink_vs_quack_with_layernorm.svg b/oink/benchmarks/media/sm100_fp16_oink_vs_quack_with_layernorm.svg index 5c849b54..4155d679 100644 --- a/oink/benchmarks/media/sm100_fp16_oink_vs_quack_with_layernorm.svg +++ b/oink/benchmarks/media/sm100_fp16_oink_vs_quack_with_layernorm.svg @@ -6,7 +6,7 @@ - 2026-01-22T03:17:09.483028 + 2026-04-01T15:02:45.380417 image/svg+xml @@ -41,12 +41,12 @@ z - - + @@ -176,7 +176,7 @@ z - + @@ -243,7 +243,7 @@ z - + @@ -322,7 +322,7 @@ z - + @@ -343,7 +343,7 @@ z - + @@ -365,7 +365,7 @@ z - + @@ -414,7 +414,7 @@ z - + @@ -439,16 +439,16 @@ z +" clip-path="url(#pbfed54c27f)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - - + @@ -483,18 +483,18 @@ z - + - + - + @@ -504,18 +504,18 @@ L 429.474812 286.389791 - + - + - + @@ -525,18 +525,18 @@ L 429.474812 238.23311 - + - + - + @@ -944,16 +944,16 @@ z - + - - - - - - - - - + + + + + + + + - + - - - - - - - - - + + + + + + + + +" clip-path="url(#pbfed54c27f)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1247,7 +1247,7 @@ z - + @@ -1268,7 +1268,7 @@ z - + @@ -1289,7 +1289,7 @@ z - + @@ -1310,7 +1310,7 @@ z - + @@ -1332,7 +1332,7 @@ z - + @@ -1354,7 +1354,7 @@ z - + @@ -1379,93 +1379,93 @@ z +" clip-path="url(#p9c75223483)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - - - - - - - - - + + + + + + + + + - - - - - - - - - + + + + + + + + + +" clip-path="url(#p9c75223483)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1601,7 +1601,7 @@ z - + @@ -1622,7 +1622,7 @@ z - + @@ -1643,7 +1643,7 @@ z - + @@ -1664,7 +1664,7 @@ z - + @@ -1686,7 +1686,7 @@ z - + @@ -1708,7 +1708,7 @@ z - + @@ -1733,93 +1733,93 @@ z +" clip-path="url(#p8e34d669ba)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - - - - - - - - - + + + + + + + + + - - - - - - - - - + + + + + + + + + +" clip-path="url(#p8e34d669ba)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -1948,7 +1948,7 @@ z - + @@ -1969,7 +1969,7 @@ z - + @@ -1990,7 +1990,7 @@ z - + @@ -2011,7 +2011,7 @@ z - + @@ -2033,7 +2033,7 @@ z - + @@ -2055,7 +2055,7 @@ z - + @@ -2080,93 +2080,93 @@ z +" clip-path="url(#p2a94df60a8)" style="fill: none; stroke-dasharray: 3.2,5.76; stroke-dashoffset: 0; stroke: #b0b0b0; stroke-width: 0.8"/> - + - + - + - + - + - + - + - - - - - - - - - + + + + + + + + + - - - - - - - - - + + + + + + + + + +" clip-path="url(#p2a94df60a8)" style="fill: none; stroke-dasharray: 12,18; stroke-dashoffset: 0; stroke: #4d4d4d; stroke-width: 3"/> - + @@ -2522,7 +2522,7 @@ L 835.955625 46.691969 L 852.205625 46.691969 " style="fill: none; stroke: #ff4444; stroke-width: 5; stroke-linecap: square"/> - + @@ -2585,16 +2585,16 @@ z - + - + - + - +