Aphrodite Engine:大规模LLM推理引擎,为高效部署和运行大型语言模型提供强大支持。
支持多种量化格式,如fp2-fp12,显著降低内存占用;8位KV缓存,大幅提升上下文长度和吞吐量;支持多种硬件平台,包括CUDA、TPU、Inferentia等
#LLM
支持多种量化格式,如fp2-fp12,显著降低内存占用;8位KV缓存,大幅提升上下文长度和吞吐量;支持多种硬件平台,包括CUDA、TPU、Inferentia等
#LLM
消息来源频道
@HardcoreOpenAI
提供硬核学习资源,探索开源力量,驾驭AI未来! 本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源,助你站在技术浪潮之巅,实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者,都能在这里找到属于你的宝藏!