首页  /  电商资讯
亚马逊开发出有史以来最大的文本转语音模型
2024-02-18 20:12:37
5158浏览
近年来,像 ChatGPT 这样的“大型语言模型”凭借其智能回答问题和生成高级文本的能力而备受关注。

2 月 18 日消息,亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在 arXiv 预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。

近年来,像 ChatGPT 这样的“大型语言模型”凭借其智能回答问题和生成高级文本的能力而备受关注。然而,人工智能也在逐步融入其他主流应用领域。在这个新项目中,研究人员尝试通过增加参数数量和扩充训练数据集来提升文本转语音应用的能力。

据IT之家了解,这个名为“可扩展流式文本转语音模型”(BASE TTS)的新模型拥有 9.8 亿个参数,并使用 10 万小时的录音(来自公共网站)进行训练,其中大部分为英语语音。研究人员还向模型提供了其他语言的单词和短语示例,使其能够正确发音一些常见的表达,例如“au contraire” 和 “adios, amigo”。

亚马逊团队还测试了使用较小数据集的模型,希望能从中发现人工智能领域所说的“涌现能力”。这种能力是指人工智能应用,无论是大型语言模型还是文本转语音模型,突然突破到更高智能水平的现象。他们发现,对于文本转语音应用而言,这种飞跃发生在参数量达到 1.5 亿的中型数据集上。

研究人员还指出,这种飞跃涉及一系列语言属性,例如使用复合名词、表达情感、使用外语词、应用语音学和标点符号以及正确强调句子中的关键词等能力。

研究团队表示,出于对潜在滥用风险的担忧,BASE TTS 将不会向公众开放,他们计划将其作为学习应用,并期望将学到的知识应用于改善文本转语音应用的整体音质。

推荐阅读:

京东荣获2024年度Gartner供应链技术创新奖 

深圳跨境电商规模再创新高 

1.4亿人领到淘宝春节红包 

图文阅读
6月25日,以“惠贸全球 链动未来”为主题的2025第二届惠阳跨境电商选品会暨“双百行动”共建活动在惠阳体育会展中心盛大启幕。
2025-06-30 11:38:02
阿里巴巴正朝着“一个阿里”的目标持续前进。
2025-06-24 11:37:28
在全球跨境电商的激烈角逐中,各大平台不断推陈出新,以争夺市场份额。
2025-06-24 11:34:56
今年天猫618大促期间,淘宝数字生活行业迎来爆发式增长。从美食卡券、影视会员、游戏娱乐到洗护清洁、出行保险、购物礼品卡等吃喝玩乐类消费,用户需求驱动行业成交规模显著提升。
2025-06-23 09:29:21
对于卖家来说,每年的亚马逊Prime会员日促销活动是一个不可错过的爆单机会,都在期盼着这个促销盛事的到来。
2025-06-18 10:57:22
随着吃喝玩乐相关消费数字化程度的提升,淘宝生活服务类目的成交在今年天猫618期间实现了迅猛增长,成交用户规模较日常提升近4倍!
2025-06-17 11:37:52
今年天猫618,品牌商家在淘宝闪购高速增长,3C数码、百货、服饰、快消、食品等行业多个品牌成交单量创历史新高。
2025-06-17 10:50:28
淘系商家普遍关注的“全站推广”,为帮助商家抓住大促流量红利,更好实现货品爆发,推出超亿级现金补贴扶持优质商品,助力生意增长。预售当天,阿里妈妈全站推广助超700个商品单日销量破千,超600个商品单日GMV破10万。
2025-05-15 11:21:50
最新文章
Shopee加码次日达服务,和美客多、亚马逊拼速度
2025-07-02 10:13:24
TikTok Shop上线直播拍卖功能
2025-07-02 10:09:58
淘宝闪购启动500亿元补贴计划
2025-07-02 10:02:52
Shopee越南最新调整,今日起下调平台服务费
2025-07-02 09:57:32
跨境电商平台扎堆掘金,争夺千亿南美市场
2025-07-02 09:55:47
快手电商上线“好吃不贵”官方好货精选IP
2025-07-02 09:54:16
Lazada成为泡泡玛特出海东南亚关键渠道
2025-07-02 09:50:19
聚焦AI与品牌出海,政校行企共建跨境电商生态圈
2025-06-30 11:38:02
精选专题
热门阅读
大家都在搜