llama_cpp_for_radxa_dragon_wing_q6a

History

Georgi Gerganov 6562e5a4d6 context : allow cache-less context for embeddings (#13108 ) * context : allow cache-less context for embeddings ggml-ci * context : enable reranking with encode() ggml-ci * context : encode() clears embd_seq ggml-ci * examples : use llama_encode() when appropriate ggml-ci * models : nomic bert moe does not require KV cache * llama : update comments for llama_decode/llama_encode ggml-ci * context : update warning log [no ci]		2025-05-08 14:28:33 +03:00
..
batched-bench
cvector-generator
export-lora
gguf-split
imatrix	context : remove logits_all flag (#13284 )	2025-05-08 14:26:50 +03:00
llama-bench
main	context : remove logits_all flag (#13284 )	2025-05-08 14:26:50 +03:00
mtmd	clip : refactor graph builder (#13321 )	2025-05-06 22:40:24 +02:00
perplexity	context : remove logits_all flag (#13284 )	2025-05-08 14:26:50 +03:00
quantize
rpc
run
server	context : allow cache-less context for embeddings (#13108 )	2025-05-08 14:28:33 +03:00
tokenize
tts
CMakeLists.txt