llama_cpp_for_radxa_dragon_wing_q6a

History

Xuan-Son Nguyen 6ce863c803 server: prevent data race from HTTP threads (#18263 ) * server: prevent data race from HTTP threads * fix params * fix default_generation_settings * nits: make handle_completions_impl looks less strange * stricter const * fix GGML_ASSERT(idx < states.size()) * move index to be managed by server_response_reader * http: make sure req & res lifecycle are tied together * fix compile * fix index handling buggy * fix data race for lora endpoint * nits: fix shadow variable * nits: revert redundant changes * nits: correct naming for json_webui_settings		2025-12-22 14:23:34 +01:00
..
batched-bench
cli	server: prevent data race from HTTP threads (#18263 )	2025-12-22 14:23:34 +01:00
completion
cvector-generator
export-lora
fit-params
gguf-split
imatrix
llama-bench
mtmd
perplexity
quantize
rpc
run
server	server: prevent data race from HTTP threads (#18263 )	2025-12-22 14:23:34 +01:00
tokenize
tts
CMakeLists.txt