llama_cpp_for_radxa_dragon_wing_q6a

History

Pascal 2e7e638523 server : support multiple model aliases via comma-separated --alias (#19926 ) * server : support multiple model aliases via comma-separated --alias * server : update --alias description and regenerate docs * server : multiple model aliases and tags - address review feedback from ngxson - --alias accepts comma-separated values (std::set, no duplicates) - --tags for informational metadata (not used for routing) - aliases resolve transparently in router via get_meta/has_model - /v1/models exposes aliases and tags fields * regenerate docs * nits * server : use first alias as model_name for backward compat address review feedback from ngxson * server : add single-model test for aliases and tags		2026-02-27 07:05:23 +01:00
..
batched-bench
cli	server : support multiple model aliases via comma-separated --alias (#19926 )	2026-02-27 07:05:23 +01:00
completion	server : support multiple model aliases via comma-separated --alias (#19926 )	2026-02-27 07:05:23 +01:00
cvector-generator
export-lora
fit-params
gguf-split
imatrix	model : add Jina Embeddings v5 Nano (partial EuroBERT) support (#19826 )	2026-02-26 12:14:09 +01:00
llama-bench
mtmd	mtmd : fix padding of n_tokens (#19930 )	2026-02-26 18:39:49 +02:00
perplexity
quantize	quantize : add --dry-run option (#19526 )	2026-02-20 09:20:16 +01:00
rpc
server	server : support multiple model aliases via comma-separated --alias (#19926 )	2026-02-27 07:05:23 +01:00
tokenize
tts
CMakeLists.txt