Commits · Xenobd/whisper.cpp

ci : disable freeBSD builds [no ci]

feddf3c

ggerganov commited on Dec 8, 2024

readme : update build instructions

d1e543b

ggerganov commited on Dec 8, 2024

ci : disable CUDA and Android builds

fcafd21

ggerganov commited on Dec 8, 2024

ci : disable Obj-C build + fixes

3859606

ggerganov commited on Dec 8, 2024

make : shim cmake

15c1d58

ggerganov commited on Dec 6, 2024

talk-llama : sync llama.cpp

5908a19

ggerganov commited on Dec 5, 2024

sync : ggml

00d464f

ggerganov commited on Dec 5, 2024

ggml : add predefined list of CPU backend variants to build (llama/10626)

1794b43

Diego Devesa commited on Dec 4, 2024

ggml-cpu : fix HWCAP2_I8MM value (llama/10646)

b3e6ea8

Diego Devesa commited on Dec 4, 2024

vulkan: Implement "fast divide" (mul+shift) for unary ops like copy (llama/10642)

e9ee893

jeffbolznv commited on Dec 4, 2024

SYCL : Move to compile time oneMKL interface backend selection for NVIDIA backend (llama/10584)

385f335

Nicolò Scipione commited on Dec 4, 2024

Avoid using __fp16 on ARM with old nvcc (llama/10616)

19743b6

Frankie Robertson commited on Dec 4, 2024

vulkan: optimize and reenable split_k (llama/10637)

bca95f5

jeffbolznv commited on Dec 3, 2024

ggml: add `GGML_SET` Metal kernel + i32 CPU kernel (ggml/1037)

dd775d5

PABannier commited on Dec 4, 2024

ggml : add `GGML_PAD_REFLECT_1D` operation (ggml/1034)

154bbc0

PABannier commited on Dec 3, 2024

files : remove make artifacts

d3e3ea1

ggerganov commited on Dec 3, 2024

common : fix compile warning

6a0d528

ggerganov commited on Dec 3, 2024

ggml : move AMX to the CPU backend (llama/10570)

3732429

Diego Devesa commited on Dec 3, 2024

metal : small-batch mat-mul kernels (llama/10581)

58b0822

ggerganov commited on Dec 3, 2024

SYCL: Fix and switch to GGML_LOG system instead of fprintf (llama/10579)

f083887

qnixsynapse commited on Dec 2, 2024

ggml-cpu: replace AArch64 NEON assembly with intrinsics in ggml_gemv_q4_0_4x4_q8_0() (llama/10567)

1c781a8

Adrien Gallouët commited on Nov 30, 2024

vulkan: Dynamic subgroup size support for Q6_K mat_vec (llama/10536)

59600b5

Eve commited on Nov 30, 2024

ggml : fix I8MM Q4_1 scaling factor conversion (llama/10562)

664be9a

ggerganov commited on Nov 29, 2024

ggml-cpu: fix typo in gemv/gemm iq4_nl_4_4 (llama/10580)

c7a861a

shupeif commited on Nov 29, 2024

sycl : offload of get_rows set to 0 (llama/10432)

47b6bff

Alberto Cabrera Pérez commited on Nov 29, 2024

sycl : Reroute permuted mul_mats through oneMKL (llama/10408)

af13def

Alberto Cabrera Pérez commited on Nov 29, 2024

CANN: RoPE operator optimization (llama/10563)

3ad7b0a

Chenguang Li

noemotiovon commited on Nov 29, 2024

vulkan: get the first command buffer submitted sooner (llama/10499)

e1c1e73

jeffbolznv commited on Nov 29, 2024

ggml : remove redundant copyright notice + update authors

c78cdd7

ggerganov commited on Nov 28, 2024

ggml : fix row condition for i8mm kernels (llama/10561)

01c713f

ggerganov commited on Nov 28, 2024

cmake : fix ARM feature detection (llama/10543)

c04a34f

ggerganov commited on Nov 28, 2024

ggml-cpu: support IQ4_NL_4_4 by runtime repack (llama/10541)

bf73242

shupeif commited on Nov 28, 2024

kompute : improve backend to pass test_backend_ops (llama/10542)

c8008b8

slpnix commited on Nov 28, 2024

CANN: Fix SOC_TYPE compile bug (llama/10519)

7f24ebb

leo-pony commited on Nov 28, 2024

CANN: ROPE operator optimization (llama/10540)

63ee002

Chenguang Li

noemotiovon commited on Nov 28, 2024

Add some minimal optimizations for CDNA (llama/10498)

bf49bbe

uvos commited on Nov 27, 2024