
IT之家 12 月 15 日消息,今天下午,通义大模型通过官方公众号宣布,两款“百聆”语音模型正式开源,两款模型迎来升级。根据介绍,其只需 3 秒录音,就能让你的声音无缝切换语种、方言与情绪 —— 普通话、粤语、日、英、开心、愤怒……9 种通用语言、18 种方言阜新隔热条PA66生产设备厂家,通通搞定。
升级Fun-CosyVoice3 模型升级:包延迟降低 50%,中英混字准确率翻倍,支持 9 语种 18 方言口音、跨语种克隆与情感控制;
Fun-ASR 模型能力增强:噪声场景准确率 93%、支持歌词与说唱识别、31 语种自由混说、方言口音覆盖,并将流式识别模型的字降低到 160ms。
开源Fun-CosyVoice3(0.5B)开源:提供 zero-shot 音克隆能力,支持本地部署与二次开发;
Fun-ASR-Nano(0.8B)开源:Fun-ASR 的轻量化版本,推理成本更低,模型开源,支持本地部署与定制化微调。
IT之家从官方获悉,本次,Fun-CosyVoice3 大模型完成多项关键升级:
包延迟降低 50%,支持双向流式成,真正实现“输入即发声”,适用于语音助手、直播配音、无障碍阅读等实时场景;
Q Q:183445502中英混说词错误率(WER)相比之前降低 56.4%阜新隔热条PA66生产设备厂家,不论是含业术语、大小写混排,还是语码转换的句子,都能、自然地发音;
在 zero-shot TTS 评测中,内容一致与音相似度提升,复杂场景(test-hard)字符错误率(CER)相对降低 26%,接近人类录音水平;
9 种通用语言、18 种中文方言、9 种情感控制,并具备跨语种音复刻能力 —— 用一段普通话录音,塑料挤出机设备即可生成粤语、日语、英语等语音,音保持高度一致。
而开源的 Fun-CosyVoice3-0.5B 模型提供了 zero-shot 音克隆能力,只需要你提供一段 3 秒以上的参考音频,即可复刻其音并成新语音,并且支持本地部署和二次开发。
Fun-ASR 号称能让 AI “听得懂”。其基于数千万小时真实语音数据训练,已在钉钉“AI 听记”、会议等场景中大规模落地。官方表示,该模型优化了嘈杂环境鲁棒、多语言自由混说、中文方言与口音覆盖、歌词识别、定制化能力,并将流式识别模型的字降低到 160ms。
Fun-CosyVoice3-0.5B 开源地址:
https://github.com/FunAudioLLM/CosyVoice(GitHub)阜新隔热条PA66生产设备厂家
https://funaudiollm.github.io/cosyvoice3/(GitHub.io)
https://www.modelscope.cn/studios/FunAudioLLM/Fun-CosyVoice3-0.5B(体验 demo)
https://modelscope.cn/models/FunAudioLLM/Fun-CosyVoice3-0.5B-2512(国内模型仓库)
https://huggingface.co/FunAudioLLM/Fun-CosyVoice3-0.5B-2512(海外模型仓库)
Fun-ASR-Nano-0.8B 开源地址:
https://github.com/FunAudioLLM/Fun-ASR(GitHub)
https://funaudiollm.github.io/funasr/(GitHub.io)
大天鹅一家。爸爸妈妈把亚成体的孩子夹在中间
全家欢游·冰雪之旅。打造全龄友好的“暖冬滑雪目的地”核心IP,加强“全家总动员 人生一滑”核心概念宣传,举办“十六届大连(安波)温泉滑雪节”,整金石滩、梭鱼湾、塔河湾、苍鹭湾、长兴岛等全市冰雪嬉雪资源,设计“滑雪+温泉”“滑雪+海鲜”等适全家出游的活动与线路;串联全市沿海咖啡、茶饮店铺及观景平台,开展海冰热恋季,鼓励商家推出“暖饮+观景”套餐,实现“饮品消费+景区引流”双向赋能。
每年四月,绵延125.8平方公里的杜鹃花竞相绽放,成为全国游客瞩目的焦点。然而,这片世界大的杜鹃林,也曾因“花期一过客即归”而困扰。如何让“一季红”变“四季火”?
湖北地处长江中游,自然景观富集、文化底蕴深厚、红资源丰富。这里既有长江“目楚天舒”的豪迈,也有“高峡出平湖”的壮美,更有屈子行吟、三国烽烟的历史烙印,文旅资源禀赋可谓得天厚。如今,面对旅游业态多元融、游客消费需求升级以及科技赋能文旅创新的新趋势,如何从“文旅大省”加速向“文旅强省”转变,是湖北亟待破解的课题。
https://modelscope.cn/studios/FunAudioLLM/Fun-ASR-Nano/(国内体验 demo)
https://huggingface.co/spaces/FunAudioLLM/Fun-ASR-Nano(海外体验 demo)
https://modelscope.cn/models/FunAudioLLM/fun-asr-nano-2512(国内模型仓库)
https://huggingface.co/FunAudioLLM/Fun-ASR-Nano-2512(海外模型仓库)阜新隔热条PA66生产设备厂家