llama_cpp_for_radxa_dragon_wing_q6a

History

Xuan-Son Nguyen e3af5563bd llama: store mrope data in KV cell (#16825 ) * llama: store mrope data in KV cell * correct x,y ordering * address review comments * add consistency checks * Update src/llama-kv-cache.cpp Co-authored-by: Georgi Gerganov <ggerganov@gmail.com> * add TODO * fix asan error * kv-cells : improve ext handling * cont : fix headers --------- Co-authored-by: Georgi Gerganov <ggerganov@gmail.com>		2025-10-29 18:09:18 +01:00
..
batched-bench
cvector-generator
export-lora
gguf-split
imatrix	Manually link -lbsd to resolve flock symbol on AIX (#16610 )	2025-10-23 19:37:31 +08:00
llama-bench	llama-bench : clarify benchmarked parts of the computation (#16823 )	2025-10-28 19:41:43 +02:00
main
mtmd	llama: store mrope data in KV cell (#16825 )	2025-10-29 18:09:18 +01:00
perplexity
quantize
rpc	rpc : report actual free memory (#16616 )	2025-10-17 18:02:52 +03:00
run	Manually link -lbsd to resolve flock symbol on AIX (#16610 )	2025-10-23 19:37:31 +08:00
server	memory : remove KV cache size padding (#16812 )	2025-10-28 20:19:44 +02:00
tokenize
tts
CMakeLists.txt