llama_cpp_for_radxa_dragon_wing_q6a

History

David Huang 7f323a589f Add `--no-op-offload` to improve `-ot` pp perf in MoE models like llama4 400B (#13386 )		2025-05-11 14:18:39 +02:00
..
batched-bench
cvector-generator
export-lora
gguf-split
imatrix
llama-bench	Add `--no-op-offload` to improve `-ot` pp perf in MoE models like llama4 400B (#13386 )	2025-05-11 14:18:39 +02:00
main
mtmd	Add `--no-op-offload` to improve `-ot` pp perf in MoE models like llama4 400B (#13386 )	2025-05-11 14:18:39 +02:00
perplexity
quantize
rpc
run
server	server : update docs (#13432 )	2025-05-10 18:44:49 +02:00
tokenize
tts
CMakeLists.txt