llama_cpp_for_radxa_dragon_wing_q6a

History

Xuan-Son Nguyen 4e595b250a server: do not log certain endpoints (avoid log spam) (#19028 )		2026-01-22 19:24:37 +01:00
..
batched-bench
cli	cli : fix reasoning responses in CLI (#18961 )	2026-01-20 18:23:25 +01:00
completion	llama : add adaptive-p sampler (#17927 )	2026-01-15 19:16:29 +02:00
cvector-generator
export-lora
fit-params	llama-fit-params: free memory target per device (#18679 )	2026-01-08 10:07:58 +01:00
gguf-split
imatrix
llama-bench	Setting mmap and direct_io to false as default in llama-bench.cpp (#18841 )	2026-01-16 09:46:51 +01:00
mtmd	mtmd : update docs to use llama_model_n_embd_inp (#18999 )	2026-01-22 14:36:32 +01:00
perplexity
quantize
rpc
server	server: do not log certain endpoints (avoid log spam) (#19028 )	2026-01-22 19:24:37 +01:00
tokenize
tts	refactor : remove libcurl, use OpenSSL when available (#18828 )	2026-01-14 18:02:47 +01:00
CMakeLists.txt	cmake: only build cli when server is enabled (#18670 )	2026-01-09 16:43:26 +01:00