Commits · Xenobd/whisper.cpp

whisper.android.java : fix returns in JNI (#1929)

c1b258d
unverified

zhouwg commited on Mar 5, 2024

cmake : add library versioning (#1352)

3ab7ee7
unverified

kennethge

ggerganov commited on Mar 4, 2024

readme : recommend MacOS Sonoma for Core ML (#1917)

c4e849b
unverified

Gavin Cai commited on Mar 4, 2024

talk-llama : sync llama.cpp

06c222c
unverified

ggerganov commited on Feb 28, 2024

sync : ggml

b85f30e
unverified

ggerganov commited on Feb 28, 2024

sync : llama.cpp (ggml/0)

8ea3a45
unverified

ggerganov commited on Feb 28, 2024

ggml : make i-quants work with super-blocks of 64 (CPU,Metal) (llama/5760)

9a07f42
unverified

Kawrakow

ikawrakow commited on Feb 28, 2024

Attempt to fix android build (llama/5752)

e720b3b
unverified

Kawrakow

ikawrakow commited on Feb 27, 2024

IQ4_XS: a 4.25 bpw quantization (llama/5747)

0ee1bfb
unverified

Kawrakow

ikawrakow commited on Feb 27, 2024

cuda : replace remaining shfl_xor with calls to warp_reduce functions (llama/5744)

753b30d
unverified

Engininja2 commited on Feb 27, 2024

ggml-quants : fix avx2 iq1_s vec_dot when compiled with gcc (llama/5742)

72e8610
unverified

Engininja2 commited on Feb 27, 2024

Adding IQ2_S and IQ2_M to complete coverage of the 2-3 bit quantization range (llama/5721)

2b9bb9e
unverified

Kawrakow

ikawrakow

ggerganov commited on Feb 26, 2024

CUDA: fix DEBUG_CUDA_MALLOC (llama/5729)

f18f386
unverified

JohannesGaessler commited on Feb 26, 2024

Add support for soft_max ALiBi (llama/5639)

86d6a5e
unverified

AidanBeltonS Abhilash Majumder commited on Feb 26, 2024

ggml-quants : provide ggml_vqtbl1q_u8 for 64bit compatibility (llama/5711)

430efc6
unverified

Crad commited on Feb 25, 2024

add google magika inference example (ggml/748)

10ac4bb
unverified

slaren commited on Feb 25, 2024

stream.wasm : fix invalid memory access when no segments (#1902)

3273767
unverified

Andrew S commited on Feb 26, 2024

talk-llama : sync llama.cpp

b92d757
unverified

ggerganov commited on Feb 25, 2024

sync : ggml

3eb6cbf
unverified

ggerganov commited on Feb 25, 2024

sync : llama.cpp (ggml/0)

6c535a8
unverified

ggerganov commited on Feb 25, 2024

code : normalize enum names (llama/5697)

93e0830
unverified

ggerganov commited on Feb 25, 2024

IQ3_S: a much better alternative to Q3_K (llama/5676)

32589c9
unverified

Kawrakow

ikawrakow commited on Feb 24, 2024

Introduce backend GUIDs (ggml/743)

a7eb9f6
unverified

UEXTM.com slaren commited on Feb 24, 2024

talk, talk-llama : pass text_to_speak as a file (#1865)

3fd8b4d
unverified

Tamotsu Takahashi commited on Feb 24, 2024