7 月 31 日消息,科技媒体 NeoWin 今天(7 月 31 日)发布博文,报道称微软推出了 DragonV2.1Neural 零次学习(Zero-Shot Learning)模型,仅凭少量数据就能创建更加自然、表现力强的声音,并支持超过 100 种语言。
引博文介绍,这是一种零次学习的文本到语音(TTS)模型,承诺提供更加自然和富有表现力的声音,并提高了发音的准确性以及增强了可控性。
新模型仅需几秒钟的语音样本即可合成超过 100 种语言的语音。相比之下,之前的 DragonV1 模型在处理专有名词时存在发音问题。DragonV2.1 模型可以应用于多种不同场景,包括定制聊天机器人声音和为视频内容跨多语言配音。
微软表示,DragonV2.1 提高发音准确性,与 DragonV1 相比,该模型单词错误率(WER)平均降低了 12.8%。
该模型还提升了声音的自然度,用户使用此模型时,可以利用 SSML 音素标签和自定义词典对发音和口音进行细致控制。为了帮助用户入门,微软构建了 Andrew、Ava 和 Brian 等多个声音档案,供用户测试。
2月19日消息,美国时间周一,埃隆·马斯克(Elon Musk)旗下的人工智能初创公司xAI发布了其最新大模型Grok-3。该公司不仅演示了新模型的强大性能,还展示了由20万块GPU组成的...
2 腾讯重磅!企业微信+DeepSeek来了企业微信新版本重磅上线,灰度接入满血版DeepSeek-R1大模型...
3 微软Win11开始菜单将迎大改!分享文件也更方便2月23日消息,微软日前面向Beta频道推出了Windows 11的KB5052078更新,更新后版本号升至Build22635.4950。本次更新最大的亮点,就是全新的开始菜单设计和改进的文件分享功能。微...
4 升了直接打不开!微软阻止AutoCAD 2022设备更新Win11 24H22月27日消息,微软日前更新官方支持文档称,因兼容性问题,已阻止安装AutoCAD 2022的设备升级至Windows 11 24H2版本。微软表示,AutoCAD 2022在Windows 11 24H2系统上启动时可能会...
5 苹果史上最大软件革新即将来袭:界面统一 visionOS 风格化3 月 11 日消息,彭博社的马克・古尔曼(Mark Gurman)今天(3 月 11 日)发布博文,报道称苹果公司为了重塑 iPhone、iPad 和 Mac 的用户体验,正筹备其历史上最具颠覆性的系统革新。古...
6 iOS 18.4 更新引入了一个设置默认导航应用的选项即将推出的 iOS 18.4 更新引入了一个设置默认导航应用(除 Apple 地图之外)的选项,但遗憾的是,此新设置仅限于欧盟用户。在那里,用户现在可以打开“设置”应用并点击&l...
7 谷歌Gemini 2.0 Flash模型拥有强大图片去水印功能,引发版权争议3 月 17 日消息,近期,谷歌推出的 Gemini 2.0 Flash 模型在社交媒体上引发了争议。用户发现,该模型能够去除图片中的水印,包括来自盖蒂图片社(Getty Images)等知名图库的图片水印...
8 吉卜力风格AI图像被病毒式传播,OpenAI奥特曼回应在OpenAI最新版本的图像生成技术的“助力”下,大量用户在社交媒体上分享日本吉卜力工作室风格的AI图像。OpenAI日前在GPT‑4o中推出能够精确、逼真输出的图像生成...
9 谷歌收紧安卓开源“窗口”,华为鸿蒙的“含金量”还在上升最近,谷歌陷入“安卓闭源”风波,据称安卓开源项目的更新将被转移至谷歌内部,不再面对公众开放。随后,谷歌方面回应,此举并非要对安卓系统闭源,而是改成版本重大迭代时...
10 微信新功能!网友:有意思,立马试试!近日,微信又上线新功能:微信聊天引用回复,不光可以回文字,还可以回语音和表情包了。以前微信聊天时引用回复只能回复文字现在的引用回复还可以回语音和表情包了网友评论:有意思,...
备案号:琼ICP备20001864号-1 Copyright © 2020-2021 海南金游汇电子竞技有限公司 版权所有