Commits · natasa365/whisper.cpp

vulkan: disable spirv-opt for bfloat16 shaders (llama/15352)

cf24af7

jeffbolznv commited on Aug 18

vulkan: Use larger workgroups for mul_mat_vec when M is small (llama/15355)

054584a

jeffbolznv

OccamRazor commited on Aug 17

vulkan: support sqrt (llama/15370)

e5406c0

Dong Won Kim commited on Aug 17

vulkan: Optimize argsort (llama/15354)

80a188c

jeffbolznv commited on Aug 17

vulkan: fuse adds (llama/15252)

ad199b1

jeffbolznv commited on Aug 16

vulkan: Support mul_mat_id with f32 accumulators (llama/15337)

41a76e6

jeffbolznv commited on Aug 16

vulkan: Add missing bounds checking to scalar/coopmat1 mul_mat_id (llama/15334)

a6fa78e

jeffbolznv commited on Aug 16

vulkan : fix out-of-bounds access in argmax kernel (llama/15342)

78a1865

ggerganov commited on Aug 15

vulkan : fix compile warnings on macos (llama/15340)

e3107ff

ggerganov commited on Aug 15

vulkan: perf_logger improvements (llama/15246)

d48d508

jeffbolznv commited on Aug 14

finetune: SGD optimizer, more CLI args (llama/13873)

f585fe7

Jonathan Graehl

OccamRazor

JohannesGaessler commited on Aug 14

ggml : fix field name when new ggml_backend (llama/14944)

685748d

AN Long commited on Aug 8

vulkan: support fattn sinks (llama/15126)

d7e9115

jeffbolznv commited on Aug 7

vulkan: Add env var to disable host visible vidmem (llama/15109)

5ec4382

jeffbolznv commited on Aug 7

llama : add gpt-oss (llama/15091)

bf225d6

ggerganov

ngxson HF Staff slaren commited on Aug 5

vulkan: fix build when using glslang that does not support coopmat2 (llama/15062)

863e083

jeffbolznv commited on Aug 4

vulkan: Use coopmat2 for conv2d (llama/14982)

6df82f4

jeffbolznv commited on Aug 3

vulkan: coopmat2 mul_mat optimizations (llama/14934)

ca86566

jeffbolznv commited on Aug 2

vulkan: Support ne[3]>1 in noncontig matrix-vector multiply (llama/15015)

d4c4115

jeffbolznv commited on Aug 2

vulkan: optimizations for direct convolution (llama/14933)

215f463

jeffbolznv

OccamRazor commited on Aug 2

Vulkan: Fix minor debug mode issues (llama/14899)

a81bc86

OccamRazor commited on Jul 31

vulkan : fix 32-bit builds (ggml/1313)

96b66fd

Kai Pastor commited on Jul 30

vulkan : add fp16 support for the conv_2d kernel (llama/14872)

48e92ad

Erik Scholz commited on Jul 27

vulkan: skip empty set_rows to avoid invalid API usage (llama/14860)

22fb24a

jeffbolznv commited on Jul 27

vulkan: fix rms_norm_mul to handle broadcasting dim0 (llama/14817)

0c16b60

jeffbolznv commited on Jul 22

vulkan/cuda: Fix im2col when KW!=KH (llama/14789)

0be0329

jeffbolznv commited on Jul 21

ggml: adds CONV_2D op and direct GEMM Vulkan implementation (llama/14316)

5885084

etasnadi commited on Jul 19

vulkan: Add logging for bf16 features to ggml_vk_print_gpu_info (#13274) (llama/14707)

0855a18

Peter0x44 commited on Jul 19

Vulkan: Fix fprintf format-security warning (llama/14770)

77a1c11

OccamRazor commited on Jul 19

vulkan: fix noncontig check for mat_mul_id splitting (llama/14683)

4d0d8b8

jeffbolznv commited on Jul 15

vulkan: add RTE variants for glu/add/sub/mul/div (llama/14653)

bac21a7

jeffbolznv commited on Jul 15

sync : resolve conflicts (ggml/0)

497add0

ggerganov commited on Jul 12

vulkan: support SET_ROWS (llama/14587)

9821f43

jeffbolznv commited on Jul 12

vulkan: optimizations for deepseek prompt processing (llama/14555)

04b631e

jeffbolznv commited on Jul 12

ggml : add ggml_scale_bias (llama/14417)

573d50a

ngxson HF Staff commited on Jul 9

vulkan: optimize flash attention split_k_reduce (llama/14554)

45fbb42

jeffbolznv commited on Jul 8

vulkan : fix rope with partial rotation and non-cont src (llama/14582)

367fa85

jeffbolznv commited on Jul 8

vulkan: increase LOAD_VEC_A to 8 (IQ1/IQ2) or 4 (IQ3) (llama/14485)

effd61f

Eve Rémy Oudompheng commited on Jul 6

vulkan: fix rms_norm+mul fusion (llama/14545)

0791e65

jeffbolznv commited on Jul 6

vulkan: Handle updated FA dim2/3 definition (llama/14518)

d1e619e

jeffbolznv commited on Jul 5

ggml : implement GEGLU_ERF and GEGLU_QUICK ops (llama/14445)

f798922

Sigbjørn Skjæret commited on Jul 3

vulkan: support mixed/deepseekR1 FA head sizes (llama/14509)

90cefa0

jeffbolznv commited on Jul 3

kv-cache : use ggml_set_rows (llama/14285)

7d6d9e8

ggerganov commited on Jul 3

ggml : fix FA mask dim 2 and 3 (llama/14505)

a89dc81

ggerganov commited on Jul 3

vulkan: support softmax/FA batch and broadcast (llama/14449)

f6b0b76

jeffbolznv commited on Jul 1

ggml : support bcast ggml_soft_max_ext, ggml_flash_attn_ext (llama/14435)

ebacb3e

ggerganov commited on Jul 12

vulkan: Split large mul_mat_id to fit in shared memory (llama/14451)

bf678f0

jeffbolznv commited on Jul 1

add GELU_ERF (llama/14455)

235ebf7

Sigbjørn Skjæret commited on Jul 1

vulkan : implement bilinear interpolation for ggml_upscale/ggml_interpolate (ggml/1291)

666e65b

Acly commited on Jul 3

vulkan : implement ggml_roll (ggml/1290)

968f9e8

Acly commited on Jul 3

Commit History

vulkan: disable spirv-opt for bfloat16 shaders (llama/15352) cf24af7

vulkan: Use larger workgroups for mul_mat_vec when M is small (llama/15355) 054584a

vulkan: support sqrt (llama/15370) e5406c0

vulkan: Optimize argsort (llama/15354) 80a188c

vulkan: fuse adds (llama/15252) ad199b1

vulkan: Support mul_mat_id with f32 accumulators (llama/15337) 41a76e6

vulkan: Add missing bounds checking to scalar/coopmat1 mul_mat_id (llama/15334) a6fa78e

vulkan : fix out-of-bounds access in argmax kernel (llama/15342) 78a1865

vulkan : fix compile warnings on macos (llama/15340) e3107ff

vulkan: perf_logger improvements (llama/15246) d48d508

finetune: SGD optimizer, more CLI args (llama/13873) f585fe7

ggml : fix field name when new ggml_backend (llama/14944) 685748d

vulkan: support fattn sinks (llama/15126) d7e9115

vulkan: Add env var to disable host visible vidmem (llama/15109) 5ec4382

llama : add gpt-oss (llama/15091) bf225d6

vulkan: fix build when using glslang that does not support coopmat2 (llama/15062) 863e083

vulkan: Use coopmat2 for conv2d (llama/14982) 6df82f4

vulkan: coopmat2 mul_mat optimizations (llama/14934) ca86566

vulkan: Support ne[3]>1 in noncontig matrix-vector multiply (llama/15015) d4c4115

vulkan: optimizations for direct convolution (llama/14933) 215f463

Vulkan: Fix minor debug mode issues (llama/14899) a81bc86

vulkan : fix 32-bit builds (ggml/1313) 96b66fd

vulkan : add fp16 support for the conv_2d kernel (llama/14872) 48e92ad

vulkan: skip empty set_rows to avoid invalid API usage (llama/14860) 22fb24a

vulkan: fix rms_norm_mul to handle broadcasting dim0 (llama/14817) 0c16b60

vulkan/cuda: Fix im2col when KW!=KH (llama/14789) 0be0329

ggml: adds CONV_2D op and direct GEMM Vulkan implementation (llama/14316) 5885084

vulkan: Add logging for bf16 features to ggml_vk_print_gpu_info (#13274) (llama/14707) 0855a18

Vulkan: Fix fprintf format-security warning (llama/14770) 77a1c11

vulkan: fix noncontig check for mat_mul_id splitting (llama/14683) 4d0d8b8

vulkan: add RTE variants for glu/add/sub/mul/div (llama/14653) bac21a7

sync : resolve conflicts (ggml/0) 497add0

vulkan: support SET_ROWS (llama/14587) 9821f43

vulkan: optimizations for deepseek prompt processing (llama/14555) 04b631e

ggml : add ggml_scale_bias (llama/14417) 573d50a

vulkan: optimize flash attention split_k_reduce (llama/14554) 45fbb42

vulkan : fix rope with partial rotation and non-cont src (llama/14582) 367fa85

vulkan: increase LOAD_VEC_A to 8 (IQ1/IQ2) or 4 (IQ3) (llama/14485) effd61f

vulkan: fix rms_norm+mul fusion (llama/14545) 0791e65

vulkan: Handle updated FA dim2/3 definition (llama/14518) d1e619e

ggml : implement GEGLU_ERF and GEGLU_QUICK ops (llama/14445) f798922

vulkan: support mixed/deepseekR1 FA head sizes (llama/14509) 90cefa0

kv-cache : use ggml_set_rows (llama/14285) 7d6d9e8

ggml : fix FA mask dim 2 and 3 (llama/14505) a89dc81

vulkan: support softmax/FA batch and broadcast (llama/14449) f6b0b76

ggml : support bcast ggml_soft_max_ext, ggml_flash_attn_ext (llama/14435) ebacb3e

vulkan: Split large mul_mat_id to fit in shared memory (llama/14451) bf678f0

add GELU_ERF (llama/14455) 235ebf7

vulkan : implement bilinear interpolation for ggml_upscale/ggml_interpolate (ggml/1291) 666e65b

vulkan : implement ggml_roll (ggml/1290) 968f9e8

vulkan: disable spirv-opt for bfloat16 shaders (llama/15352)

cf24af7

vulkan: Use larger workgroups for mul_mat_vec when M is small (llama/15355)

054584a

vulkan: support sqrt (llama/15370)

e5406c0

vulkan: Optimize argsort (llama/15354)

80a188c

vulkan: fuse adds (llama/15252)

ad199b1

vulkan: Support mul_mat_id with f32 accumulators (llama/15337)

41a76e6

vulkan: Add missing bounds checking to scalar/coopmat1 mul_mat_id (llama/15334)

a6fa78e

vulkan : fix out-of-bounds access in argmax kernel (llama/15342)

78a1865

vulkan : fix compile warnings on macos (llama/15340)

e3107ff

vulkan: perf_logger improvements (llama/15246)

d48d508

finetune: SGD optimizer, more CLI args (llama/13873)

f585fe7

ggml : fix field name when new ggml_backend (llama/14944)

685748d

vulkan: support fattn sinks (llama/15126)

d7e9115

vulkan: Add env var to disable host visible vidmem (llama/15109)

5ec4382

llama : add gpt-oss (llama/15091)

bf225d6

vulkan: fix build when using glslang that does not support coopmat2 (llama/15062)

863e083

vulkan: Use coopmat2 for conv2d (llama/14982)

6df82f4

vulkan: coopmat2 mul_mat optimizations (llama/14934)

ca86566

vulkan: Support ne[3]>1 in noncontig matrix-vector multiply (llama/15015)

d4c4115

vulkan: optimizations for direct convolution (llama/14933)

215f463

Vulkan: Fix minor debug mode issues (llama/14899)

a81bc86

vulkan : fix 32-bit builds (ggml/1313)

96b66fd

vulkan : add fp16 support for the conv_2d kernel (llama/14872)

48e92ad

vulkan: skip empty set_rows to avoid invalid API usage (llama/14860)

22fb24a

vulkan: fix rms_norm_mul to handle broadcasting dim0 (llama/14817)

0c16b60

vulkan/cuda: Fix im2col when KW!=KH (llama/14789)

0be0329

ggml: adds CONV_2D op and direct GEMM Vulkan implementation (llama/14316)

5885084

vulkan: Add logging for bf16 features to ggml_vk_print_gpu_info (#13274) (llama/14707)

0855a18

Vulkan: Fix fprintf format-security warning (llama/14770)

77a1c11

vulkan: fix noncontig check for mat_mul_id splitting (llama/14683)

4d0d8b8

vulkan: add RTE variants for glu/add/sub/mul/div (llama/14653)

bac21a7

sync : resolve conflicts (ggml/0)

497add0

vulkan: support SET_ROWS (llama/14587)

9821f43

vulkan: optimizations for deepseek prompt processing (llama/14555)

04b631e

ggml : add ggml_scale_bias (llama/14417)

573d50a

vulkan: optimize flash attention split_k_reduce (llama/14554)

45fbb42

vulkan : fix rope with partial rotation and non-cont src (llama/14582)

367fa85

vulkan: increase LOAD_VEC_A to 8 (IQ1/IQ2) or 4 (IQ3) (llama/14485)

effd61f

vulkan: fix rms_norm+mul fusion (llama/14545)

0791e65

vulkan: Handle updated FA dim2/3 definition (llama/14518)

d1e619e

ggml : implement GEGLU_ERF and GEGLU_QUICK ops (llama/14445)

f798922

vulkan: support mixed/deepseekR1 FA head sizes (llama/14509)

90cefa0

kv-cache : use ggml_set_rows (llama/14285)

7d6d9e8

ggml : fix FA mask dim 2 and 3 (llama/14505)

a89dc81

vulkan: support softmax/FA batch and broadcast (llama/14449)

f6b0b76

ggml : support bcast ggml_soft_max_ext, ggml_flash_attn_ext (llama/14435)

ebacb3e

vulkan: Split large mul_mat_id to fit in shared memory (llama/14451)

bf678f0

add GELU_ERF (llama/14455)

235ebf7

vulkan : implement bilinear interpolation for ggml_upscale/ggml_interpolate (ggml/1291)

666e65b

vulkan : implement ggml_roll (ggml/1290)

968f9e8