您当前的位置：首页 > 新闻资讯 > 科技

只需 15 分钟，iPhone 就能「复制」你的声音

时间：2023-06-08 10:15:33 来源：中国家电网作者：

+ 加入收藏

史蒂芬·霍金的「机械电音」，也许是世界上其中一个最有辨识度的声音。

但那并不是霍金自己的声音。

在霍金因渐冻症(ALS)失去说话能力的年代，技术还不足以让他能生成自己声音。事实上，能用上语音合成器的人都屈指可数。

到了今天，ALS 患者虽然有了更多语音合成的选择，但总体费用和时间门槛仍然不低，普及度也有限。

最近，苹果公布了全新无障碍功能 Personal Voice(暂未上线)，不仅让用户能免费「备份」自己的声音，同时还在安全地应用 AI 技术上，作出了一次有意思的尝试。

只需 15 分钟「调教」，就能生成你的声音

　　▲ 图自 Fastcompany

在生成式 AI 可以模仿一切的时代里，用 AI 模仿一个人的声音听起来已经不算新奇，只是感觉有点安全隐患。

我好奇的，更多是苹果要怎样安全和高效地实现 Personal Voice 这一功能。

据介绍，iphone、iPad 和 mac 用户只需要根据提示录制 15 分钟的音频，苹果就会基于设备端的机器学习技术来生成和用户一样的声音。

相比之下，为失语群体提供专业语音合成服务的公司，可能需要采用专业设备，录制几小时的语音素材，价格最低都要数百美元。

另一项新无障碍功能 Live Speech，则支持用户打电话、FaceTime 或者是和他人面对面对话的时候，输入文字即可生成语音内容，为失语或不方便说话的用户提供另一种「发声」方式。

结合 Personal Voice 和 Live Speech 两项功能，失语用户就能用接近自己原本声音的生成声音和他人沟通。

用起来是方便了，但怎样避免有人用网上扒的语音素材来生成他人的声音?

素材随机化。

在录制 15 分钟语音素材的过程中，苹果将随机生成需要用户朗读的内容，减少他人猜中素材的可能性。

物理距离屏障。

在录制过程中，用户需要在距离设备 6-10 英寸(约 15- 25 厘米)的特定空间里完成录制。

在生成过程中，所有数据都将通过苹果的 Neural Engine(神经引擎)在设备本地完成，不必要上传到云处理。

语音合成后，第三方应用如果想使用 Personal Voice，都要获得用户明确授权。

即便第三方应用获得授权使用时，苹果也会采用额外的背景保护，确保第三方应用无法获取 Personal Voice 以及用户之前所录制的语音素材。

如果是苹果「全家桶」用户，生成自己的 Personal Voice 后还能通过 iCloud 同步到不同设备上，并以端对端的方式加密。

自己的声音，失去了才懂多重要

人是感性的生物，而声音是很强烈的情感触发器。

有研究指出，当人在听到母亲的声音时，身体释放出催产素水平和跟妈妈拥抱时产生的程度很相似。另一个研究则指出，听到自己的声音，会增强一个人的自我能动性。

这听起来有点抽象。

但当我们失去它时，重要性就变得显而易见了。

2021 年 3 月，Ruth Brunton 被确诊 ALS。那年圣诞，她就已经失语了。

ALS 患者中，约有 25% 的人患的是「延髓起病型」肌萎缩侧索硬化症，主要表现是说话障碍或吞咽困难。这类病人说话会逐渐变得含糊、带有鼻音，甚至失语。

Brunton 的行动很果断，确诊后马上找公司去做语音生成。

来回花了一个月时间，录了 3000 多个句子的语料，但最后出来的结果并不理想。

那家公司用的是一种名为「单元选择(unit selection)」技术。

简单粗暴来说，它就是通过「拼接」来实现语音生成，把语料拆分为大量小的语音单元，然后按需把元素拼起来。

　　▲单元选择技术下，「Bob」这一词语能被拆分成不同语音元素，图自《华盛顿邮报》

这种技术生成的语音能听清，但会有点电音，听起来不太自然。

结果就是，Brunton 录制的语料结合了微软一个名为「Heather」的声音，不但声音和自己毫不相似，甚至逼着这英国人「讲」起了美语口音。

困在这个声音里，Brunton「只会在必要的时候说话，不再是因为想说话而说话」。

从前和丈夫打闹聊天的心情消失了，Brunton 也不怎么愿意参加多人对话。

即便是说「我爱你」，用一个不像自己的声音来说，意义也似乎被削弱了。

六个月后， Brunton 和丈夫争取回了最初录制的语音素材，找了另一家公司，用 AI 技术合成了一个更像她自己的声音：

这听起来也许有点傻，但重新获得自己的声音让我更有自信了。

在波士顿儿童医院负责「增强沟通」项目的 John M. Costello 留意到，那些采用了更真实生成语音的病人，似乎更能够和亲近的人建立深厚的联结。

2022 年圣诞节，「重获新声」的 Brunton 还用语音录制的一段节日祝语。

然而，圣诞刚过，Brunton 就染上了新冠，最后在今年 2 月离世了。

她离开的那晚，丈夫 David 一整夜都握着她的手：

我们有两年时间来告别。

我们说好了，我们要说尽一切我们想说的。

难以想象，如果 Brunton 后来没换上更像自己的声音，她又是否能自在地说出想说的一切。

无障碍思维点亮灵感，AI 燃起生产力

我一直认为，无障碍设计所挖掘的，其实就是人类多样性创造的想象力资源。

我们去到和自己有着截然不同生活体验的人面前，聆听更少被诉说的故事和体验，创造出我们之前没想象过，但却能对更多人友好的的新生活方式。

Personal Voice 能让失语的 ALS 患者重新获得自己的声音;也可以帮助在经历「刀片嗓」的我用自己的声音去和其他人对话;甚至，我也很难避免会去想象，是否应该用这为自己「备份」声音留给亲近的人，以免哪天自己会突然离世。

而 AI 技术，就是实现这些想象力生产力。

正如杜编辑之前说的，虽然不赶生成式 AI 的热闹，但苹果一直都把 AI 用来提升用户体验 —— 提升效率，保护隐私。

提升效率，在于提升本地执行的机器学习算法和模型。

除了 Personal Voice 以外，苹果这次预览的另一个无障碍功能 Point and Speak 也采用了本地设备端的机器学习技术。

未来，视障用户在 iPhone 自带的放大器里，结合 Point and Speak 和旁白功能，就能凭自己手指把 iPhone 变成「点读机」—— 点到哪儿，让 iPhone 给你把文字读到哪儿。

去年的「门检测」功能道理也类似，让设备端的机器学习帮视障用户识别出门，并朗读出门上面的信息和周围的标识。

至于隐私，按乔布斯说的，就是「如果你需要他们(用户)的数据，那就向他们(用户)请求。每一次都如此。」

这在无障碍设计方面也尤其重要 —— 因为这些功能设计起源就是服务被所谓「常规设计」忽略的人，常常都是更弱势的群体，因此更有必要确保这些用户的隐私不受侵害。

在这个语境下，我们也可开启更多关于数据应用权和透明度的讨论。

苹果这次做 Personal Voice 时，和帮助 ALS 患者的非盈利机构 Team Gleason Foundation 合作。

　　▲ Team Gleason Foundation CEO Blair Casey(右)

该机构的 CEO Blair Casey 一直也在推动语音生成公司设定一套标准录制素材设定，让用户能直接录这部分素材，并体验不同公司生成出来的语音效果，而不是像现在一样「盲赌」。

同时，Casey 也主张语音生成公司把用户录制的语音素材数据提供给用户(因为很多用户可能录制后就失语了)，以免他们未来想把这些数据用在其他技术上：

如果更好的技术出来了，你会不想试一试吗?

如果你没法拿回自己的语音素材，你就没法去试。

AI 也许是我们时代最强的生产力。

但是，这力该怎么使，也许以人为本的无障碍设计能给它不少指引。

Tags：声音点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

笔记本电脑没有声音？这些原因和解决方法你一定需要！

当笔记本电脑没有声音时，这可能是由于多种原因造成的，包括软件问题、硬件问题或者设置错误等。下面我将详细介绍可能导致笔记本无声的各种原因，并提供解决方法：1. 音量设置问题：...【详细内容】

2024-04-11　　Search: 声音点击:(3)　　评论:(0)　　加入收藏

微信语言、听筒，没有声音提醒？原来是这几个地方没设置，望知晓

微信作为我们日常生活中不可或缺的通讯工具，其功能的完善和使用体验的优化一直是用户们关注的焦点。然而，有时候我们可能会遇到微信语音或听筒没有声音提醒的问题，这不仅影响了...【详细内容】

2024-04-09　　Search: 声音点击:(5)　　评论:(0)　　加入收藏

耳机为什么能发出声音？

耳机发出声音的原理涉及到声音的产生和传播，以及电磁感应等物理原理。简单来说，声音是由物体的振动产生的，这种振动产生声波并通过介质（如空气、固体等）传播，最终被我们的耳朵接收...【详细内容】

2024-02-28　　Search: 声音点击:(33)　　评论:(0)　　加入收藏

手机声音太小，打开这个开关

近期有很多粉丝朋友像我反馈说自己的手机声音特别小，不管是打电话还是看电视，刷视频，放音乐，声音都非常小，特别是别人打来一个电话，由于声音小听不清楚，这样就会导致错过很多事情了...【详细内容】

2024-01-30　　Search: 声音点击:(36)　　评论:(0)　　加入收藏

手机键盘声音怎么关掉

关掉手机键盘声音是一个相对简单的操作，不需要太复杂的步骤。在不同的手机品牌和型号上可能会有稍微不同的设置方法，但总体来说，以下是关闭手机键盘声音的常见方法：方法一：通过手...【详细内容】

2024-01-17　　Search: 声音点击:(56)　　评论:(0)　　加入收藏

手机声音越用越小？原来是这个开关没打开，不知道就太可惜了

不知道大家用久了手机有没有发现这样的一个问题，就是无论我们怎么把手机的音量给它调大，但是当我们打电话、视频聊天，再或者是刷视频的时候，手机的音量呢依然是很小。那么相信你...【详细内容】

2023-12-28　　Search: 声音点击:(78)　　评论:(0)　　加入收藏

录制音频被另作商用是否侵权？全国首例“AI声音侵权案”审理

□ 本报记者徐伟伦AI技术的应用，为我们的生活带来巨大变化。当AI技术应用到声音领域，是否面临侵权风险？司法又将如何回应？近日，北京互联网法院组成五人合议庭，依法公开审理全国首...【详细内容】

2023-12-20　　Search: 声音点击:(66)　　评论:(0)　　加入收藏

如何用Java实现音频合成和声音识别？

音频合成和声音识别在Java中是一个相对复杂的任务，但是有一些强大的库和工具可以帮助我们实现这些功能。下面将提供一个基本的指南，介绍如何用Java实现音频合成和声音识别。1...【详细内容】

2023-12-15　　Search: 声音点击:(186)　　评论:(0)　　加入收藏

苹果电话声音小？只需一招，轻松解决

在使用苹果手机打电话时，有时候会遇到声音小的问题，这让人感到非常困扰。不要担心，本文将教你一招，轻松解决这个问题。一、检查音量设置首先，请确保你的音量设置是正确的。在苹果...【详细内容】

2023-12-11　　Search: 声音点击:(70)　　评论:(0)　　加入收藏

耳机插进电脑检测到了，但是麦克风没声音，应该如何解决？

在日常生活中，我们经常会使用电脑进行视频录制、在线会议或语音聊天等操作，此时麦克风的重要性不言而喻。然而，有些用户在使用耳机（比如一魔声学E500 Pro接音频线）进行视频录制时...【详细内容】

2023-11-20　　Search: 声音点击:(186)　　评论:(0)　　加入收藏

▌简易百科推荐

英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电

新华财经上海4月11日电当地时间4月9日，英特尔在Vision 2024客户和合作伙伴大会上宣布推出最新AI芯片产品Gaudi 3加速器。英特尔称，相比英伟达的H100 GPU，Gaudi3 AI芯片的模型...【详细内容】

2024-04-11　　　　上海证券报　　Tags:英特尔　点击:(2)　　评论:(0)　　加入收藏

AI“复活”亲人成生意，哪些红线待划定？

提供一张照片、一段10多秒的音频，即可让逝者在视频中“活”过来——AI“复活”亲人成生意，哪些红线待划定？本报记者陶稳《工人日报》(2024年04月11日 06版)阅读提示...【详细内容】

2024-04-11　　　　工人日报　　Tags:AI 　点击:(2)　　评论:(0)　　加入收藏

谷歌推出适用于安卓设备的“查找我的设备”网络

IT之家 4 月 9 日消息，谷歌今日推出了适用于安卓设备的“查找我的设备”网络，其功能类似于苹果的“查找”网络，旨在帮助用户定位丢失、被盗的安卓产品。IT之家注意到，与苹果的“...【详细内容】

2024-04-09　　　　IT之家　　Tags:安卓　点击:(2)　　评论:(0)　　加入收藏

你的自拍和聊天记录，正被硅谷大厂砸数十亿美元疯抢

2026年的数据荒越来越近，硅谷大厂们已经为AI训练数据抢疯了。它们纷纷豪掷十数亿美元，希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过，如果有一天AI忽然吐出了我们的...【详细内容】

2024-04-09　　　　新智元　　Tags:硅谷　点击:(2)　　评论:(0)　　加入收藏

谷歌搜索史上最大变革！考虑对AI搜索收费

快科技4月7日消息，据国外媒体报道，谷歌正计划对由生成式人工智能驱动的新高级功能收费，这将是谷歌搜索业务历史上最大的一次变革。自2000年以来，谷歌的搜索产品一直依靠广告盈利...【详细内容】

2024-04-08　　　　快科技　　Tags:谷歌搜索　点击:(8)　　评论:(0)　　加入收藏

为训练AI，OpenAI等科技巨头花式淘数据

[环球时报特约记者甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频，形成对话文本数据，供其最新的AI学习...【详细内容】

2024-04-08　　　　环球网　　Tags:AI 　点击:(9)　　评论:(0)　　加入收藏

训出GPT-5短缺20万亿token！OpenAI被曝计划建「数据市场」

全网真的无数据可用了！外媒报道称，OpenAl、Anthropic等公司正在努力寻找足够的信息，来训练下一代人工智能模型。前几天，OpenAI和微软被曝出正在联手打造超算「星际之门」，解决算...【详细内容】

2024-04-08　　　　新智元　　Tags:GPT-5 　点击:(2)　　评论:(0)　　加入收藏

当“机器人”有了“AI大脑” 人形机器人时代来了吗

数智风向标当“机器人”有了“AI大脑”人形机器人时代来了吗简单明了的口令下达后，机器人便开始搬箱子、运小球，在各类不同的地形行走……这些身上布满芯片和传...【详细内容】

2024-04-08　　　　中国青年报　　Tags:机器人　点击:(5)　　评论:(0)　　加入收藏

报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4

IT之家 4 月 7 日消息，本周早些时候，《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天，《纽约时报》详细介绍了 AI 公司处理此问题的一些方法，其中涉及到...【详细内容】

2024-04-07　　　　IT之家　　Tags:OpenAI 　点击:(7)　　评论:(0)　　加入收藏

量子计算会和经典计算一样融入人们的日常生活

作为2024中国网络媒体论坛打造的创新活动之一，“技术赋能·八点见”创新项目发布会于3月30日晚在云南昆明举行。活动现场，本源量子计算科技（合肥）股份有限公司（以下简称“...【详细内容】

2024-04-03　　　　人民网　　Tags:量子计算　点击:(8)　　评论:(0)　　加入收藏

推荐资讯

网易再牵暴雪的手，实际	注意！密码、验证码都没
将他人商标设为搜索关	打破刚兑：投资者还能相
拜登坐不住了？罕见对美	黄金狂飙如何影响人民
重新审视2008年全球金	京东掷10亿现金扶持达

站内最新

栏目相关

· 英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电

· AI“复活”亲人成生意，哪些红线待划定？

· 谷歌推出适用于安卓设备的“查找我的设备”网络

· 你的自拍和聊天记录，正被硅谷大厂砸数十亿美元疯抢

· 谷歌搜索史上最大变革！考虑对AI搜索收费

· 为训练AI，OpenAI等科技巨头花式淘数据

· 训出GPT-5短缺20万亿token！OpenAI被曝计划建「数据市场」

· 当“机器人”有了“AI大脑” 人形机器人时代来了吗

· 报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4

· 量子计算会和经典计算一样融入人们的日常生活

· ChatGPT官宣免注册，全球互联网变天！OpenAI将取代谷歌搜索？

· 谷歌为了结集体诉讼，同意删除 Chrome 无痕模式下收集的用户数据

· 哥伦比亚大学华人开发「人脸机器人」，照镜子自主模仿人类表情超逼真

· 谷歌服务现已支持使用 Windows Hello 人脸和指纹解锁登录

· GPT商店热度不尽人意仅用在写论文和炒股票上较受欢迎

· 距实现全球安全量子通信更近一步：量子点源产生近乎完美纠缠光子对

· 中国三大运营商共同发布通过GSMA Open Gateway认证的一次性密码 API

· 马斯克脑机接口再造奇迹：瘫痪小伙意念玩赛车击败正常人

· 国家数据局局长刘烈宏：充分发挥数据要素价值培育新质生产力

· 谷歌Chrome巨变：第三方Cookie的终结将重塑互联网格局

站内热门