llama_cpp_for_radxa_dragon_wing_q6a

History

Xuan-Son Nguyen ddcb75dd8a server: add auto-sleep after N seconds of idle (#18228 ) * implement sleeping at queue level * implement server-context suspend * add test * add docs * optimization: add fast path * make sure to free llama_init * nits * fix use-after-free * allow /models to be accessed during sleeping, fix use-after-free * don't allow accessing /models during sleep, it is not thread-safe * fix data race on accessing props and model_meta * small clean up * trailing whitespace * rm outdated comments		2025-12-21 02:24:42 +01:00
..
batched-bench
cli	server: add auto-sleep after N seconds of idle (#18228 )	2025-12-21 02:24:42 +01:00
completion	arg: clarify auto kvu/np being set on server (#17997 )	2025-12-16 12:01:27 +01:00
cvector-generator
export-lora
fit-params	llama-fit-params: QoL impr. for prints/errors (#18089 )	2025-12-17 00:03:19 +01:00
gguf-split
imatrix
llama-bench
mtmd	model : add ASR support for LFM2-Audio-1.5B (conformer) (#18106 )	2025-12-19 00:18:01 +01:00
perplexity
quantize
rpc
run
server	server: add auto-sleep after N seconds of idle (#18228 )	2025-12-21 02:24:42 +01:00
tokenize
tts
CMakeLists.txt