llama_cpp_for_radxa_dragon_wing_q6a

History

Johannes Gäßler 5c86c9ed3e CUDA: fix crash on large batch size for MoE models (#13384 )		2025-05-09 12:14:04 +02:00
..
cmake	scripts : update sync + fix cmake merge	2025-03-27 10:09:29 +02:00
include	CUDA: fix bad asserts for partial offload (#13337 )	2025-05-06 13:58:51 +02:00
src	CUDA: fix crash on large batch size for MoE models (#13384 )	2025-05-09 12:14:04 +02:00
.gitignore
CMakeLists.txt	whisper: remove MSVC warnings pragmas (whisper/3090)	2025-05-07 17:28:36 +03:00