新手上路 3小时前
主楼
[资源名称]
qwen600
[资源来源]
github.com
[资源介绍]
qwen600 一个基于 QWEN3-0.6B 模型的推理引擎,使用 CUDA C/C++ 从零构建。支持推理模式和思维链模式,通过编译时静态优化和高效内存管道提升性能,仅依赖 cuBLAS 和 CUB 库,无 Python 依赖。
[资源合集]
😀 😊 😵‍💫 😡 🤝 🙏 👍 👎 ❤️