whisper.cpp

Running

App Files Files Community

whisper.cpp

Commit History

sync : ggml

2ed0a44
unverified

ggerganov HF Staff commited on Jan 12, 2024

backend_sched : fix assignments

cb91db5
unverified

slaren commited on Jan 12, 2024

llama : ggml-backend integration (llama/4766)

362430b
unverified

slaren

ggerganov HF Staff

JohannesGaessler commited on Jan 12, 2024

CUDA: fix softmax compile for old CUDA versions (llama/4862)

5eda533
unverified

JohannesGaessler commited on Jan 12, 2024

Importance Matrix calculation (llama/4861)

c0b17f1
unverified

Kawrakow

ikawrakow

ggerganov HF Staff commited on Jan 12, 2024

models : make all scripts to be POSIX Compliant (#1725)

f7aef3e
unverified

sonphantrung commited on Jan 12, 2024

ggml : fix 32-bit ARM compat for IQ2_XS (#1758)

d5836c9
unverified

ggerganov HF Staff commited on Jan 12, 2024

go : add SetInitialPrompt method to bindings (#1753)

5fd6678
unverified

blib321 commited on Jan 12, 2024

server : add more parameters to server api (#1754)

cb0cf7b
unverified

George Hindle commited on Jan 12, 2024

whisper : fix segment length with params.no_timestamps == true

720d738
unverified

ggerganov HF Staff commited on Jan 12, 2024

params : don't compute timestamps when not printing them (#1755)

251825e
unverified

George Hindle commited on Jan 12, 2024

talk-llama : sync llama.cpp

f33490f
unverified

ggerganov HF Staff commited on Jan 11, 2024

swift : remove local ggml.h reference

98b68e8
unverified

ggerganov HF Staff commited on Jan 11, 2024

swift : track ggml release branch

ece2b9d
unverified

ggerganov HF Staff commited on Jan 11, 2024

sync : ggml

9af4c11
unverified

ggerganov HF Staff commited on Jan 11, 2024

sync : llama.cpp

569565f
unverified

ggerganov HF Staff commited on Jan 11, 2024

ggml : SOTA 2-bit quants (add IQ2_XS) (llama/4856)

5e827d5
unverified

Kawrakow

ikawrakow commited on Jan 11, 2024

metal : put encoder debug group behind a define (llama/4873)

6e822b8
unverified

Paul Tsochantaris commited on Jan 11, 2024

metal : improve dequantize precision to match CPU (llama/4836)

f2da2a4
unverified

ggerganov HF Staff commited on Jan 9, 2024

ggml : fix vld1q_s8_x4 32-bit compat (llama/4828)

efed5ba
unverified

ggerganov HF Staff commited on Jan 9, 2024

CUDA: faster softmax via shared memory + fp16 math (llama/4742)

52c45b9
unverified

JohannesGaessler commited on Jan 9, 2024

metal : fix deprecation warning (ggml/690)

b1e29bc
unverified

ggerganov HF Staff commited on Jan 11, 2024

ggml : remove ggml_cpy_inplace and ggml_cont_inplace (ggml/693)

6469bfe
unverified

Timothy Cronin commited on Jan 11, 2024

metal : wrap each operation in debug group (ggml/690)

b5e360f
unverified

Jack Mousseau commited on Jan 10, 2024

ggml : change GGML_MAX_NAME at compile time (ggml/682)

ded2b1a
unverified

leejet commited on Jan 10, 2024

Fix execlp call (ggml/689)

abda16e
unverified

Halalaluyafail3 commited on Jan 9, 2024

SOTA 2-bit quants (llama/4773)

75de5bf
unverified

Kawrakow

ikawrakow commited on Jan 8, 2024

CUDA: fixed redundant value dequantization (llama/4809)

70c8d60
unverified

JohannesGaessler commited on Jan 7, 2024

ggml : use __builtin_amdgcn_sudot4 in __dp4a for gfx11 (llama/4787)

f391d7a
unverified

Konstantin Zhuravlyov commited on Jan 7, 2024

ggml : do not sched_yield when calling BLAS (llama/4761)

5d1dffc
unverified

ggerganov HF Staff commited on Jan 5, 2024

ggml : include stdlib.h before intrin.h (llama/4736)

743cace
unverified

ggerganov HF Staff commited on Jan 4, 2024

swift : checkout ggml commit instead of branch (#1750)

6ab88cc
unverified

Alexandru Mariuti commited on Jan 10, 2024

talk-llama : add optional Piper TTS support (#1749)

fb92e62
unverified

RhinoDevel commited on Jan 10, 2024

server : add request path option(#1741)

6c319ac
unverified

eschmidbauer commited on Jan 8, 2024

main : add cli option to disable system prints (#1740)

97e710a
unverified

ggerganov HF Staff commited on Jan 8, 2024

server : fix server temperature + add temperature_inc (#1729)

8a648fc
unverified

ggerganov HF Staff commited on Jan 7, 2024

talk-llama : sync latest llama.cpp

42123fc
unverified

ggerganov HF Staff commited on Jan 6, 2024

release : v1.5.4

96799a3
unverified

ggerganov HF Staff commited on Jan 5, 2024

fix : cuda order of synchronization when setting a buffer (ggml/679)

e48c553
unverified

Erik Scholz slaren commited on Jan 5, 2024

metal : switch back to default.metallib (ggml/681)

b945a8f
unverified

ggerganov HF Staff commited on Jan 5, 2024

ggml : fix q2_k bpw in comments (ggml/680)

269f9a0
unverified

ggerganov HF Staff commited on Jan 5, 2024

coreml : fix ANE optimized encoder (#1716)

a75904e
unverified

philloooo commited on Jan 4, 2024

whisper.swiftui : add .gitignore

8061081
unverified

ggerganov HF Staff commited on Jan 4, 2024

whispser : reset the "batched" timings (#1721)

f02be35
unverified

ggerganov HF Staff commited on Jan 4, 2024

release : v1.5.3

1f8a047
unverified

ggerganov HF Staff commited on Jan 3, 2024

swift : update Package.swift to use ggml as package dependency (#1701)

77f731f
unverified

1-ashraful-islam commited on Jan 3, 2024

ggml : add error handling to graph_compute (#1714)

92f24ee
unverified

finnvoorhees commited on Jan 3, 2024

cuda : simplify expression

cda4a91

ggerganov HF Staff slaren commited on Jan 3, 2024

cuda : mark I16 and I32 ops as unsupported

cec288d

ggerganov HF Staff commited on Jan 3, 2024

metal : add kernel_get_rows_i32

459dd87

ggerganov HF Staff commited on Jan 3, 2024

Commit History

sync : ggml 2ed0a44 unverified

backend_sched : fix assignments cb91db5 unverified

llama : ggml-backend integration (llama/4766) 362430b unverified

CUDA: fix softmax compile for old CUDA versions (llama/4862) 5eda533 unverified

Importance Matrix calculation (llama/4861) c0b17f1 unverified

models : make all scripts to be POSIX Compliant (#1725) f7aef3e unverified

ggml : fix 32-bit ARM compat for IQ2_XS (#1758) d5836c9 unverified

go : add SetInitialPrompt method to bindings (#1753) 5fd6678 unverified

server : add more parameters to server api (#1754) cb0cf7b unverified

whisper : fix segment length with params.no_timestamps == true 720d738 unverified

params : don't compute timestamps when not printing them (#1755) 251825e unverified

talk-llama : sync llama.cpp f33490f unverified

swift : remove local ggml.h reference 98b68e8 unverified

swift : track ggml release branch ece2b9d unverified

sync : ggml 9af4c11 unverified

sync : llama.cpp 569565f unverified

ggml : SOTA 2-bit quants (add IQ2_XS) (llama/4856) 5e827d5 unverified

metal : put encoder debug group behind a define (llama/4873) 6e822b8 unverified

metal : improve dequantize precision to match CPU (llama/4836) f2da2a4 unverified

ggml : fix vld1q_s8_x4 32-bit compat (llama/4828) efed5ba unverified

CUDA: faster softmax via shared memory + fp16 math (llama/4742) 52c45b9 unverified

metal : fix deprecation warning (ggml/690) b1e29bc unverified

ggml : remove ggml_cpy_inplace and ggml_cont_inplace (ggml/693) 6469bfe unverified

metal : wrap each operation in debug group (ggml/690) b5e360f unverified

ggml : change GGML_MAX_NAME at compile time (ggml/682) ded2b1a unverified

Fix execlp call (ggml/689) abda16e unverified

SOTA 2-bit quants (llama/4773) 75de5bf unverified

CUDA: fixed redundant value dequantization (llama/4809) 70c8d60 unverified

ggml : use __builtin_amdgcn_sudot4 in __dp4a for gfx11 (llama/4787) f391d7a unverified

ggml : do not sched_yield when calling BLAS (llama/4761) 5d1dffc unverified

ggml : include stdlib.h before intrin.h (llama/4736) 743cace unverified

swift : checkout ggml commit instead of branch (#1750) 6ab88cc unverified

talk-llama : add optional Piper TTS support (#1749) fb92e62 unverified

server : add request path option(#1741) 6c319ac unverified

main : add cli option to disable system prints (#1740) 97e710a unverified

server : fix server temperature + add temperature_inc (#1729) 8a648fc unverified

talk-llama : sync latest llama.cpp 42123fc unverified

release : v1.5.4 96799a3 unverified

fix : cuda order of synchronization when setting a buffer (ggml/679) e48c553 unverified

metal : switch back to default.metallib (ggml/681) b945a8f unverified

ggml : fix q2_k bpw in comments (ggml/680) 269f9a0 unverified

coreml : fix ANE optimized encoder (#1716) a75904e unverified

whisper.swiftui : add .gitignore 8061081 unverified

whispser : reset the "batched" timings (#1721) f02be35 unverified

release : v1.5.3 1f8a047 unverified

swift : update Package.swift to use ggml as package dependency (#1701) 77f731f unverified

ggml : add error handling to graph_compute (#1714) 92f24ee unverified

cuda : simplify expression cda4a91

cuda : mark I16 and I32 ops as unsupported cec288d

metal : add kernel_get_rows_i32 459dd87

sync : ggml

2ed0a44
unverified

backend_sched : fix assignments

cb91db5
unverified

llama : ggml-backend integration (llama/4766)

362430b
unverified

CUDA: fix softmax compile for old CUDA versions (llama/4862)

5eda533
unverified

Importance Matrix calculation (llama/4861)

c0b17f1
unverified

models : make all scripts to be POSIX Compliant (#1725)

f7aef3e
unverified

ggml : fix 32-bit ARM compat for IQ2_XS (#1758)

d5836c9
unverified

go : add SetInitialPrompt method to bindings (#1753)

5fd6678
unverified

server : add more parameters to server api (#1754)

cb0cf7b
unverified

whisper : fix segment length with params.no_timestamps == true

720d738
unverified

params : don't compute timestamps when not printing them (#1755)

251825e
unverified

talk-llama : sync llama.cpp

f33490f
unverified

swift : remove local ggml.h reference

98b68e8
unverified

swift : track ggml release branch

ece2b9d
unverified

sync : ggml

9af4c11
unverified

sync : llama.cpp

569565f
unverified

ggml : SOTA 2-bit quants (add IQ2_XS) (llama/4856)

5e827d5
unverified

metal : put encoder debug group behind a define (llama/4873)

6e822b8
unverified

metal : improve dequantize precision to match CPU (llama/4836)

f2da2a4
unverified

ggml : fix vld1q_s8_x4 32-bit compat (llama/4828)

efed5ba
unverified

CUDA: faster softmax via shared memory + fp16 math (llama/4742)

52c45b9
unverified

metal : fix deprecation warning (ggml/690)

b1e29bc
unverified

ggml : remove ggml_cpy_inplace and ggml_cont_inplace (ggml/693)

6469bfe
unverified

metal : wrap each operation in debug group (ggml/690)

b5e360f
unverified

ggml : change GGML_MAX_NAME at compile time (ggml/682)

ded2b1a
unverified

Fix execlp call (ggml/689)

abda16e
unverified

SOTA 2-bit quants (llama/4773)

75de5bf
unverified

CUDA: fixed redundant value dequantization (llama/4809)

70c8d60
unverified

ggml : use __builtin_amdgcn_sudot4 in __dp4a for gfx11 (llama/4787)

f391d7a
unverified

ggml : do not sched_yield when calling BLAS (llama/4761)

5d1dffc
unverified

ggml : include stdlib.h before intrin.h (llama/4736)

743cace
unverified

swift : checkout ggml commit instead of branch (#1750)

6ab88cc
unverified

talk-llama : add optional Piper TTS support (#1749)

fb92e62
unverified

server : add request path option(#1741)

6c319ac
unverified

main : add cli option to disable system prints (#1740)

97e710a
unverified

server : fix server temperature + add temperature_inc (#1729)

8a648fc
unverified

talk-llama : sync latest llama.cpp

42123fc
unverified

release : v1.5.4

96799a3
unverified

fix : cuda order of synchronization when setting a buffer (ggml/679)

e48c553
unverified

metal : switch back to default.metallib (ggml/681)

b945a8f
unverified

ggml : fix q2_k bpw in comments (ggml/680)

269f9a0
unverified

coreml : fix ANE optimized encoder (#1716)

a75904e
unverified

whisper.swiftui : add .gitignore

8061081
unverified

whispser : reset the "batched" timings (#1721)

f02be35
unverified

release : v1.5.3

1f8a047
unverified

swift : update Package.swift to use ggml as package dependency (#1701)

77f731f
unverified

ggml : add error handling to graph_compute (#1714)

92f24ee
unverified

cuda : simplify expression

cda4a91

cuda : mark I16 and I32 ops as unsupported

cec288d

metal : add kernel_get_rows_i32

459dd87