消息来源频道

硬核开源智库

@HardcoreOpenAI

频道811 位成员公开可见持续更新

提供硬核学习资源,探索开源力量,驾驭AI未来! 本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源,助你站在技术浪潮之巅,实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者,都能在这里找到属于你的宝藏!

成员规模811 位成员
在线情况待同步
消息总数1,140 条消息
浏览量总数116,736 次浏览

在这个频道里搜索消息……

t.me/HardcoreOpenAI

SecoustiCodec:实现跨模态对齐的超低码率实时语音编解码技术
• 码率超低,仅0.27-1 kbps,极大节省带宽资源
• 跨模态对齐,保证文本与语音的同步,提升语义一致性
• 说话人特征保留,语义与副语言信息有效解耦,保真度高
• 流式架构支持实时处理,适合在线语音传输和通信场景
• 高效编码:结合变分自编码器(VAE)与有限状态量化(FSQ)技术
• 开源且支持多平台快速部署(Ubuntu/macOS),易于集成和二次开发
• 提供两种模型版本,分别支持21.5 Hz(0.27 kbps)和86 Hz(1.0 kbps)帧率,满足不同需求