Commits · natasa365/whisper.cpp

Vulkan: Set device max size for host memory to avoid OOM warning and fallback to CPU buffer (llama/14249)

08debcd

OccamRazor commited on Jun 19, 2025

cmake: remove shader-gen step-targets from ggml-vulkan (llama/14226)

b7a7257

bandoti commited on Jun 17, 2025

cmake: clean up external project logic for vulkan-shaders-gen (llama/14179)

bc8b1f7

bandoti commited on Jun 16, 2025

vulkan: mutex around vkQueueSubmit (llama/14127)

ef3a7d0

jeffbolznv commited on Jun 16, 2025

vulkan: Better thread-safety for command pools/buffers (llama/14116)

fdc26e7

jeffbolznv commited on Jun 11, 2025

vulkan: Track descriptor pools/sets per-context (llama/14109)

855a3bf

jeffbolznv commited on Jun 11, 2025

Vulkan: Don't default to CPU device (like llvmpipe), even if no other device is available, to allow fallback to CPU backend (llama/14099)

dcb106f

OccamRazor commited on Jun 10, 2025

vulkan: Enable VK_KHR_cooperative_matrix extension for Intel Xe2 GPUs (llama/14001)

e5107fe

rillomas commited on Jun 5, 2025

vulkan: automatically deduce size of push constants (llama/13936)

00a9e2f

jeffbolznv commited on Jun 5, 2025

ggml-vulkan: adds support for op CONV_TRANSPOSE_1D (llama/13813)

32985b0

etasnadi commited on Jun 4, 2025

vulkan: fix warnings in perf logger querypool code (llama/13937)

11bac96

jeffbolznv commited on Jun 3, 2025

vulkan: use timestamp queries for GGML_VULKAN_PERF (llama/13817)

56ddc5b

jeffbolznv commited on May 27, 2025

vulkan : Remove unexpected ; (ggml/1253)

c4be6fb

Kai Pastor commited on May 31, 2025

vulkan: mark IM2COL as supporting non-contig (llama/13783)

09c03ad

jeffbolznv commited on May 26, 2025

vulkan: support CPY from any type to itself (llama/13695)

f5f766b

jeffbolznv commited on May 23, 2025

vulkan: Disable coopmat/coopmat2/bfloat extensions if glslc doesn't support it (llama/13696)

69679f5

jeffbolznv commited on May 23, 2025

use LOG_WARN to replace `std::cerr` (llama/13657)

6975ec2

Judd commited on May 23, 2025

vulkan: fix warnings (llama/13626)

8602d10

Eve commited on May 20, 2025

Vulkan: Add f32 accumulator support to quantized mul mat to fix GLM4 32B incoherence (llama/13607)

dfa38af

OccamRazor commited on May 19, 2025

cmake: use the current build config for vulkan-shaders-gen (llama/13595)

7681e32

Gilad S. commited on May 17, 2025

vulkan: move common FA code to flash_attn_base.comp (llama/13556)

ad8b504

jeffbolznv commited on May 17, 2025

vulkan: use scalar FA rather than coopmat2 when N==1 (llama/13554)

97d9aa6

jeffbolznv commited on May 17, 2025

cmake: simplify vulkan shader test logic (llama/13263)

f8fd66d

bandoti commited on May 14, 2025

vulkan: KHR_coopmat flash attention (llama/13506)

4d1bd4f

jeffbolznv commited on May 14, 2025

vulkan: workaround FA compile failures on macos (llama/13517)

06833bc

jeffbolznv commited on May 14, 2025

vulkan: scalar flash attention implementation (llama/13324)

3331abd

jeffbolznv commited on May 10, 2025

vulkan: Allow up to 4096 elements for mul_mat_id row_ids (llama/13326)

53f8fee

jeffbolznv commited on May 9, 2025

vulkan: Additional type support for unary, binary, and copy (llama/13266)

b9cb11e

jeffbolznv commited on May 4, 2025

vulkan : fix lint (llama/0)

49be727

ggerganov commited on May 2, 2025

vulkan: Add bfloat16 support (llama/12554)

b21f8a1

jeffbolznv commited on May 1, 2025

vulkan: Handle src1 batch dimension in non-contiguous mat-vec-mul shader (llama/13191)

710fdcf

jeffbolznv commited on May 1, 2025

vulkan : kernels for depthwise 2D convolution (CONV_2D_DW) (ggml/1204)

43d9f3e

Acly commited on May 2, 2025

vulkan: use uint array index to avoid glslang bug (llama/13193)

fd2d86d

jeffbolznv commited on Apr 30, 2025

vulkan: matmul gcn tuning (llama/13016)

ac537d2

Eve

OccamRazor commited on Apr 24, 2025

vulkan: support noncontiguous rms_norm (llama/13031)

e4d1f59

jeffbolznv commited on Apr 20, 2025

graph : make FA compatible with MLA + add initial Metal kernels (llama/12953)

fb0d243

ggerganov commited on Apr 17, 2025

vulkan: enable coopmat2 FA gqa and split_k optimizations more often (llama/12931)

f844153

jeffbolznv commited on Apr 16, 2025

vulkan: use aligned loads for flash attention mask (llama/12853)

825889e

jeffbolznv commited on Apr 12, 2025

vulkan: In coopmat2 mmq, load q4_k/q5_k scales through shared memory (llama/12833)

4b7a407

jeffbolznv commited on Apr 9, 2025

vulkan: Use fp16 for the flash attention P*V multiplication (llama/12783)

4e46f41

jeffbolznv commited on Apr 9, 2025

ggml : add bilinear upscale support (ggml/1185)

4c5e449

Diego Devesa commited on Apr 9, 2025

vulkan: fix NaN issue in flash attention shader (llama/12776)

77d7613

jeffbolznv commited on Apr 6, 2025

vulkan: Use unclamped loads for flash attention mask (llama/12720)

a76ef69

jeffbolznv commited on Apr 6, 2025

Vulkan: Tune Vulkan mmq int dot shader for performance (llama/12767)

b3bf710

OccamRazor commited on Apr 5, 2025

cmake: fix ggml-shaders-gen compiler paths containing spaces (llama/12747)

1c89b7d

Ronny Brendel commited on Apr 4, 2025

vulkan: Hybrid waitForFences/getFenceStatus to reduce fence latency (llama/12630)

ee422be

jeffbolznv commited on Apr 4, 2025

vulkan: set cmake minimum and project name in vulkan-shaders (llama/12744)

2459781

jeffbolznv commited on Apr 4, 2025

vulkan: Fix missing cmake logic for dot product extension (llama/12721)

7a1e8f8

jeffbolznv commited on Apr 3, 2025

vulkan: Implement split_k for coopmat2 flash attention. (llama/12627)

5ab06d6

jeffbolznv commited on Apr 2, 2025

cmake: remove caching from vulkan coopmat checks (llama/12719)

fac18c1

bandoti commited on Apr 2, 2025

Commit History

Vulkan: Set device max size for host memory to avoid OOM warning and fallback to CPU buffer (llama/14249) 08debcd

cmake: remove shader-gen step-targets from ggml-vulkan (llama/14226) b7a7257

cmake: clean up external project logic for vulkan-shaders-gen (llama/14179) bc8b1f7

vulkan: mutex around vkQueueSubmit (llama/14127) ef3a7d0

vulkan: Better thread-safety for command pools/buffers (llama/14116) fdc26e7

vulkan: Track descriptor pools/sets per-context (llama/14109) 855a3bf

Vulkan: Don't default to CPU device (like llvmpipe), even if no other device is available, to allow fallback to CPU backend (llama/14099) dcb106f

vulkan: Enable VK_KHR_cooperative_matrix extension for Intel Xe2 GPUs (llama/14001) e5107fe

vulkan: automatically deduce size of push constants (llama/13936) 00a9e2f

ggml-vulkan: adds support for op CONV_TRANSPOSE_1D (llama/13813) 32985b0

vulkan: fix warnings in perf logger querypool code (llama/13937) 11bac96

vulkan: use timestamp queries for GGML_VULKAN_PERF (llama/13817) 56ddc5b

vulkan : Remove unexpected ; (ggml/1253) c4be6fb

vulkan: mark IM2COL as supporting non-contig (llama/13783) 09c03ad

vulkan: support CPY from any type to itself (llama/13695) f5f766b

vulkan: Disable coopmat/coopmat2/bfloat extensions if glslc doesn't support it (llama/13696) 69679f5

use LOG_WARN to replace `std::cerr` (llama/13657) 6975ec2

vulkan: fix warnings (llama/13626) 8602d10

Vulkan: Add f32 accumulator support to quantized mul mat to fix GLM4 32B incoherence (llama/13607) dfa38af

cmake: use the current build config for vulkan-shaders-gen (llama/13595) 7681e32

vulkan: move common FA code to flash_attn_base.comp (llama/13556) ad8b504

vulkan: use scalar FA rather than coopmat2 when N==1 (llama/13554) 97d9aa6

cmake: simplify vulkan shader test logic (llama/13263) f8fd66d

vulkan: KHR_coopmat flash attention (llama/13506) 4d1bd4f

vulkan: workaround FA compile failures on macos (llama/13517) 06833bc

vulkan: scalar flash attention implementation (llama/13324) 3331abd

vulkan: Allow up to 4096 elements for mul_mat_id row_ids (llama/13326) 53f8fee

vulkan: Additional type support for unary, binary, and copy (llama/13266) b9cb11e

vulkan : fix lint (llama/0) 49be727

vulkan: Add bfloat16 support (llama/12554) b21f8a1

vulkan: Handle src1 batch dimension in non-contiguous mat-vec-mul shader (llama/13191) 710fdcf

vulkan : kernels for depthwise 2D convolution (CONV_2D_DW) (ggml/1204) 43d9f3e

vulkan: use uint array index to avoid glslang bug (llama/13193) fd2d86d

vulkan: matmul gcn tuning (llama/13016) ac537d2

vulkan: support noncontiguous rms_norm (llama/13031) e4d1f59

graph : make FA compatible with MLA + add initial Metal kernels (llama/12953) fb0d243

vulkan: enable coopmat2 FA gqa and split_k optimizations more often (llama/12931) f844153

vulkan: use aligned loads for flash attention mask (llama/12853) 825889e

vulkan: In coopmat2 mmq, load q4_k/q5_k scales through shared memory (llama/12833) 4b7a407

vulkan: Use fp16 for the flash attention P*V multiplication (llama/12783) 4e46f41

ggml : add bilinear upscale support (ggml/1185) 4c5e449

vulkan: fix NaN issue in flash attention shader (llama/12776) 77d7613

vulkan: Use unclamped loads for flash attention mask (llama/12720) a76ef69

Vulkan: Tune Vulkan mmq int dot shader for performance (llama/12767) b3bf710

cmake: fix ggml-shaders-gen compiler paths containing spaces (llama/12747) 1c89b7d

vulkan: Hybrid waitForFences/getFenceStatus to reduce fence latency (llama/12630) ee422be

vulkan: set cmake minimum and project name in vulkan-shaders (llama/12744) 2459781

vulkan: Fix missing cmake logic for dot product extension (llama/12721) 7a1e8f8

vulkan: Implement split_k for coopmat2 flash attention. (llama/12627) 5ab06d6

cmake: remove caching from vulkan coopmat checks (llama/12719) fac18c1