Commits · natasa365/whisper.cpp

vulkan: Use larger workgroups for mul_mat_vec when M is small (llama/15355)

054584a

jeffbolznv

OccamRazor commited on Aug 17

vulkan: support sqrt (llama/15370)

e5406c0

Dong Won Kim commited on Aug 17

vulkan: Optimize argsort (llama/15354)

80a188c

jeffbolznv commited on Aug 17

vulkan: fuse adds (llama/15252)

ad199b1

jeffbolznv commited on Aug 16

vulkan: Support mul_mat_id with f32 accumulators (llama/15337)

41a76e6

jeffbolznv commited on Aug 16

vulkan : fix out-of-bounds access in argmax kernel (llama/15342)

78a1865

ggerganov commited on Aug 15

vulkan : fix compile warnings on macos (llama/15340)

e3107ff

ggerganov commited on Aug 15

vulkan: perf_logger improvements (llama/15246)

d48d508

jeffbolznv commited on Aug 14

finetune: SGD optimizer, more CLI args (llama/13873)

f585fe7

Jonathan Graehl

OccamRazor

JohannesGaessler commited on Aug 14

ggml : fix field name when new ggml_backend (llama/14944)

685748d

AN Long commited on Aug 8

vulkan: support fattn sinks (llama/15126)

d7e9115

jeffbolznv commited on Aug 7

vulkan: Add env var to disable host visible vidmem (llama/15109)

5ec4382

jeffbolznv commited on Aug 7

llama : add gpt-oss (llama/15091)

bf225d6

ggerganov

ngxson HF Staff slaren commited on Aug 5

vulkan: fix build when using glslang that does not support coopmat2 (llama/15062)

863e083

jeffbolznv commited on Aug 4

vulkan: Use coopmat2 for conv2d (llama/14982)

6df82f4

jeffbolznv commited on Aug 3

vulkan: coopmat2 mul_mat optimizations (llama/14934)

ca86566

jeffbolznv commited on Aug 2

vulkan: Support ne[3]>1 in noncontig matrix-vector multiply (llama/15015)

d4c4115

jeffbolznv commited on Aug 2

vulkan: optimizations for direct convolution (llama/14933)

215f463

jeffbolznv

OccamRazor commited on Aug 2

Vulkan: Fix minor debug mode issues (llama/14899)

a81bc86

OccamRazor commited on Jul 31

vulkan : fix 32-bit builds (ggml/1313)

96b66fd

Kai Pastor commited on Jul 30

vulkan : add fp16 support for the conv_2d kernel (llama/14872)

48e92ad

Erik Scholz commited on Jul 27

vulkan: skip empty set_rows to avoid invalid API usage (llama/14860)

22fb24a

jeffbolznv commited on Jul 27

vulkan: fix rms_norm_mul to handle broadcasting dim0 (llama/14817)

0c16b60

jeffbolznv commited on Jul 22

ggml: adds CONV_2D op and direct GEMM Vulkan implementation (llama/14316)

5885084

etasnadi commited on Jul 19

vulkan: Add logging for bf16 features to ggml_vk_print_gpu_info (#13274) (llama/14707)

0855a18

Peter0x44 commited on Jul 19

vulkan: fix noncontig check for mat_mul_id splitting (llama/14683)

4d0d8b8

jeffbolznv commited on Jul 15

vulkan: add RTE variants for glu/add/sub/mul/div (llama/14653)

bac21a7

jeffbolznv commited on Jul 15

sync : resolve conflicts (ggml/0)

497add0

ggerganov commited on Jul 12

vulkan: support SET_ROWS (llama/14587)

9821f43

jeffbolznv commited on Jul 12

vulkan: optimizations for deepseek prompt processing (llama/14555)

04b631e

jeffbolznv commited on Jul 12

ggml : add ggml_scale_bias (llama/14417)

573d50a

ngxson HF Staff commited on Jul 9

vulkan: optimize flash attention split_k_reduce (llama/14554)

45fbb42

jeffbolznv commited on Jul 8

vulkan: fix rms_norm+mul fusion (llama/14545)

0791e65

jeffbolznv commited on Jul 6

vulkan: Handle updated FA dim2/3 definition (llama/14518)

d1e619e

jeffbolznv commited on Jul 5

ggml : implement GEGLU_ERF and GEGLU_QUICK ops (llama/14445)

f798922

Sigbjørn Skjæret commited on Jul 3

vulkan: support mixed/deepseekR1 FA head sizes (llama/14509)

90cefa0

jeffbolznv commited on Jul 3

kv-cache : use ggml_set_rows (llama/14285)

7d6d9e8

ggerganov commited on Jul 3

ggml : fix FA mask dim 2 and 3 (llama/14505)

a89dc81

ggerganov commited on Jul 3

vulkan: support softmax/FA batch and broadcast (llama/14449)

f6b0b76

jeffbolznv commited on Jul 1

ggml : support bcast ggml_soft_max_ext, ggml_flash_attn_ext (llama/14435)

ebacb3e

ggerganov commited on Jul 12

vulkan: Split large mul_mat_id to fit in shared memory (llama/14451)

bf678f0

jeffbolznv commited on Jul 1

add GELU_ERF (llama/14455)

235ebf7

Sigbjørn Skjæret commited on Jul 1

vulkan : implement bilinear interpolation for ggml_upscale/ggml_interpolate (ggml/1291)

666e65b

Acly commited on Jul 3

vulkan : implement ggml_roll (ggml/1290)

968f9e8

Acly commited on Jul 3

ggml : implement REGLU/GEGLU/SWIGLU ops (llama/14158)

add5c0f

Sigbjørn Skjæret

ggerganov

OccamRazor Akarshan

jeffbolznv commited on Jun 29

vulkan: Add fusion support for RMS_NORM+MUL (llama/14366)

737f12d

jeffbolznv slaren commited on Jun 29

vulkan: handle noncontig in the final case of ggml_vk_get_cpy_pipeline (llama/14378)

1c3b94c

jeffbolznv commited on Jun 28

vulkan: lock accesses of pinned_memory vector (llama/14333)

59dca4f

jeffbolznv commited on Jun 28

Add support for VK_EXT_debug_utils to add labels to Vulkan objects. (llama/13792)

2c3741a

Markus Tavenrath commited on Jun 21

Vulkan: Set device max size for host memory to avoid OOM warning and fallback to CPU buffer (llama/14249)

08debcd

OccamRazor commited on Jun 19

Commit History

vulkan: Use larger workgroups for mul_mat_vec when M is small (llama/15355) 054584a

vulkan: support sqrt (llama/15370) e5406c0

vulkan: Optimize argsort (llama/15354) 80a188c

vulkan: fuse adds (llama/15252) ad199b1

vulkan: Support mul_mat_id with f32 accumulators (llama/15337) 41a76e6

vulkan : fix out-of-bounds access in argmax kernel (llama/15342) 78a1865

vulkan : fix compile warnings on macos (llama/15340) e3107ff

vulkan: perf_logger improvements (llama/15246) d48d508

finetune: SGD optimizer, more CLI args (llama/13873) f585fe7

ggml : fix field name when new ggml_backend (llama/14944) 685748d

vulkan: support fattn sinks (llama/15126) d7e9115

vulkan: Add env var to disable host visible vidmem (llama/15109) 5ec4382

llama : add gpt-oss (llama/15091) bf225d6

vulkan: fix build when using glslang that does not support coopmat2 (llama/15062) 863e083

vulkan: Use coopmat2 for conv2d (llama/14982) 6df82f4

vulkan: coopmat2 mul_mat optimizations (llama/14934) ca86566

vulkan: Support ne[3]>1 in noncontig matrix-vector multiply (llama/15015) d4c4115

vulkan: optimizations for direct convolution (llama/14933) 215f463

Vulkan: Fix minor debug mode issues (llama/14899) a81bc86

vulkan : fix 32-bit builds (ggml/1313) 96b66fd

vulkan : add fp16 support for the conv_2d kernel (llama/14872) 48e92ad

vulkan: skip empty set_rows to avoid invalid API usage (llama/14860) 22fb24a

vulkan: fix rms_norm_mul to handle broadcasting dim0 (llama/14817) 0c16b60

ggml: adds CONV_2D op and direct GEMM Vulkan implementation (llama/14316) 5885084

vulkan: Add logging for bf16 features to ggml_vk_print_gpu_info (#13274) (llama/14707) 0855a18

vulkan: fix noncontig check for mat_mul_id splitting (llama/14683) 4d0d8b8

vulkan: add RTE variants for glu/add/sub/mul/div (llama/14653) bac21a7

sync : resolve conflicts (ggml/0) 497add0

vulkan: support SET_ROWS (llama/14587) 9821f43

vulkan: optimizations for deepseek prompt processing (llama/14555) 04b631e

ggml : add ggml_scale_bias (llama/14417) 573d50a

vulkan: optimize flash attention split_k_reduce (llama/14554) 45fbb42

vulkan: fix rms_norm+mul fusion (llama/14545) 0791e65

vulkan: Handle updated FA dim2/3 definition (llama/14518) d1e619e

ggml : implement GEGLU_ERF and GEGLU_QUICK ops (llama/14445) f798922

vulkan: support mixed/deepseekR1 FA head sizes (llama/14509) 90cefa0

kv-cache : use ggml_set_rows (llama/14285) 7d6d9e8

ggml : fix FA mask dim 2 and 3 (llama/14505) a89dc81

vulkan: support softmax/FA batch and broadcast (llama/14449) f6b0b76

ggml : support bcast ggml_soft_max_ext, ggml_flash_attn_ext (llama/14435) ebacb3e

vulkan: Split large mul_mat_id to fit in shared memory (llama/14451) bf678f0

add GELU_ERF (llama/14455) 235ebf7

vulkan : implement bilinear interpolation for ggml_upscale/ggml_interpolate (ggml/1291) 666e65b

vulkan : implement ggml_roll (ggml/1290) 968f9e8

ggml : implement REGLU/GEGLU/SWIGLU ops (llama/14158) add5c0f

vulkan: Add fusion support for RMS_NORM+MUL (llama/14366) 737f12d

vulkan: handle noncontig in the final case of ggml_vk_get_cpy_pipeline (llama/14378) 1c3b94c

vulkan: lock accesses of pinned_memory vector (llama/14333) 59dca4f

Add support for VK_EXT_debug_utils to add labels to Vulkan objects. (llama/13792) 2c3741a

Vulkan: Set device max size for host memory to avoid OOM warning and fallback to CPU buffer (llama/14249) 08debcd