ChatGPT快速迭代、大模型乱战……AI开始以前所未有的速度渗透进入人们生活,而就在大部分人盯着人机对话、AI生图等多少有些“同质化”观感的AI主流应用时,以微软、腾讯为代表的科技巨头,已经将目光放到了输入法上,一场新的AI入口争夺战悄然开打。
01
可预测输入内容的输入法
提到微软输入法,笔者第一反其实是使用了多年的智能ABC,事实上,微软在全球输入法领域的布局很早,其在2016年就并购了SwiftKey,后者是一家于2008年创立的输入法公司,SwiftKey产品的一大亮点在于其基于SMS消息学习的混合人工智能技术,能够预测下一个单词的用户打算键入,在AI应用高速崛起的当下,SwiftKey自然成为融合的“试验田”。
2023年4月,微软近日发布了Beta版SwiftKey 输入法应用,最值得关注的改进就是可以和必应(New Bing)聊天了。用户在Beta版SwiftKey版本的左上角看到一个必应图标,点击之后会跳出提示,“欢迎在SwiftKey中使用 Bing。Bing使用人工智能,能够在网页上寻找答案,提供不同样式的推荐,并支持聊天”。
SwiftKey首界面提示
用户可以通过在 SwiftKey键盘上点击Bing图标来启动Bing人工智能聊天机器人,并在任何应用中与之交互。例如,用户可以在短信、电子邮件、社交媒体或网页浏览器中使用 Bing 人工智能聊天机器人来搜索信息、获取建议或执行任务。而SwiftKey 中的对话样式共有“专业”(professional)、“休闲”(casual)、“礼貌”(polite)和“社交”(social)四种,有不同的对话风格。
据了解,Bing人工智能聊天机器人旨在为用户提供更加便捷、个性化和有趣的搜索体验,并帮助用户完成各种任务,例如查询天气、订餐、写作、学习等。用户可以通过与 Bing 人工智能聊天机器人进行对话来获取所需的信息,或者使用Bing的搜索结果来进行更深入的研究。
多种对话模式可选
看似简单的融合却让AI与输入法融合起来,通过与输入法这一极为高频应用融合,可以让用户在任何应用中都能方便地使用 Bing 来搜索信息,并享受到Bing人工智能聊天机器人带来的优势,提升用户体验的同时,也让输入法成为AI新的入口。
02
新包装下的旧故事
输入法与AI的融合并非全新概念,多年前众输入法就开始从AI上找突破的机会。百度、讯飞等科技企业早些年都有发布融入AI概念的输入法产品,不过这批产品更多围绕字词联想、语音输入等方面进行优化,强调语音、语义理解和用户习惯偏好采集与优化,同当下人机对话有较大差异,以至于多年来输入法一直都是成熟而稳定的市场,微软更是在2021年的时候停止了IOS端SwiftKey输入法的更新维护,虽然用户依旧能够正常使用,却没有任何新的功能和补丁推送。去年微软更是曾一度在苹果商店下架了SwiftKey。
然而,在当下各大科技巨头的AI“军备竞赛中”,微软自从将ChatGPT背后的AI技术整合进必应之后,从搜索引擎市场的“小透明”摇身一变成为可以威胁谷歌“搜索引擎一哥”地位的劲敌。为应对微软的竞争,本周,谷歌CEO Sundar Pichai在接受采访时表示,谷歌正计划在其搜索引擎添加聊天式人工智能功能,以应对ChatGPT和微软new Bing带来的压力。
另据应用研究公司Data.ai称,整合AI技术后,必应的下载量在全球范围内跃升了8倍,同期谷歌搜索引擎应用的下载量下降了2%。
数据来源:应用研究公司Data.ai
表面上看,微软在SwiftKey输入法中融入New Bing的尝试是在优化输入法应用体验,可从New Bing当前的布局来看,微软更像是以输入法为跳板,谋求其背后的搜索引擎市场。
03
AI成下一代搜索引擎催化剂
ChatGpt在问世之前,搜索引擎以“模糊搜索”为主,用户需要根据在搜索引擎中打入关键字找到需要的内容或链接,而ChatGpt问世后,用户可以通过自然语言交互的方式轻松获得需要的内容或链接,且内容较为精准,这意味着在AI的帮助下,搜索引擎正一步步实现从“模糊搜索”到“精准推送”的跨越。
当年,谷歌Chrome凭借方便、快捷、便于交互、安全且生态完善等特点“击败”IE而称霸全球浏览器市场,可如今,ChatGPT在实现精准推送的同时符合以上特征,在此基础上,还可以帮助用户实现程序生成、文本生成以及代码编写,完全能够成为下一代搜索引擎的加速器。
今年2月,微软集成了ChatGPT的新版Bing搜索引擎悄悄上线。新版Bing更像是聊天框,客户可以聊天的方式寻找特定的主题或办法,此外,新版BING还可根据客户的想法调整其搜索查询。
新版Bing已经嵌入浏览器
微软在Bing主页上的“搜索”选项旁放入了一个此前不存在的“聊天”选项,聊天主界面写着“欢迎来到新必应,属于你的AI驱动的答案引擎”,下面三个建议框分别是“提出复杂问题”、“得到更好答案”以及“获得创意灵感”。在输入自己的问题或想查询的东西后,它就会以聊天的方式,直接回复答案或建议。加入ChatGPT功能后,用户可以通过对话来调整搜索结果。
虽然New Bing对话框设计比较有趣,也能依靠新颖的交互式对话吸引用户,但同输入法的用户数量、使用频次相比,显然后者能更好地融入用户生活。自PC时代起,输入法一直是大众与计算机进行信息交流最普惠的工具,输入法用户频繁且连续的输入需求为其带来了不俗的粘性,万物互联时代,面对复杂多样的交互界面、输入场景、用户需求,输入法实现了由工具产品、互联网产品,到智能交互产品的转化升级,而除微软之外,其他科技巨头同样在输入法领域押下重注。
04
涌入输入法领域的科技企业
输入法具备底层的、系统级的功能特性,与系统有天然结合的优势,而智能终端的崛起为输入法带来新的发展空间,日益丰富的系统底层功能,与提升智能终端交互能力的需求,为输入法打开新成长空间的同时,也让输入法成为各大科技巨头必争之地。
微软以SwiftKey输入法为跳板,谋求的无非是借New Bing打开搜索引擎市场,从而进一步提升其生态竞争力,而同处搜索引擎赛道的谷歌自然就是“天生的对手”。事实上,种种迹象表明会谷歌在Android/ target=_blank class=infotextkey>安卓版Gboard手机输入法中集成文本到图像生成器。
外媒反编译了谷歌上传到 Play 商店的 Gboard Beta 版应用(12.7.05.507749191),发现代码中有一些字符串引用了“Imagen Keyboard”。而Imagen 是谷歌的文本图像模型,号称仅仅给出一个场景的描述,Imagen 就能生成高质量、高分辨率的图像,有点像 OpenAI 的 DALL・E。
安卓版Gboard输入法
根据代码内容,“Imagen Keyboard”功能将出现在快捷方式页面中。因此可以想象一下,用户可以在“Imagen Keyboard”中输入文字,并直接生成图片,用在写作、聊天等方面。目前尚不清楚该功能将何时推出。
而除微软和谷歌两家在输入法上明争暗斗外,苹果凭借相对闭合的生态,其输入法可以按自己节奏稳步成长,反倒是国内经过这些年洗牌后,逐渐形成搜狗、讯飞、百度维持三分天下的局面,但随着去年底微信输入法的上线国内第三方输入法市场有望在AI时代迎来新一轮竞争。
以百度为例,推出了国内首款AI情感陪伴型虚拟博主,简单来说就是虚拟人和你聊天,陪你生活,可以倾听你的不快乐,也可以与你一起分享开心之处,主要还是为那些缺少朋友,没有伴侣的朋友们提供一些聊天机会。
百度输入法搭载的虚拟人物叶悠悠
百度输入法AI侃侃功能在技术上面,其所搭载的是百度文心PLATO模型,这是一个功能极其强大的对话模型。而讯飞输入法则推出AI造字功能,用户可通过手机拍照的形式,在内置系统帮助下轻松创建大量全新、美观且可读性强的手写汉字。而搜狗输入法很早就融入了AI助手的概念,微信输入法更是背靠腾讯这可“大树”,相信很快就能看到嵌入AI大模型的新版了。
05
值得关注的隐私问题
与传统输入法相比,自带搜索引擎的智能输入法不仅“猜词”更准,还开创了输入法的账号登录功能,把用户的输入习惯上传至云端,方便用户异地使用输入法和备份个人词库。
可以说,智能输入法就是一个用户专属的人工智能,用户的每一次打字都是在训练AI,只要用户联网登录自己的账号,就能切换到那个“最懂自己”的输入法。而人们在享受输入法智能便利的同时,自然也要承担个人隐私泄露的风险。
ChatGPT这样基于大语言模型的系统本身而言,这项技术并不会直接替代搜索,有分析人士指出,ChatGPT的“认知”建立在虚拟训练文本上,以及它依赖于用户个性化内容,所提供的答案也仅限于其“记忆”中存储的信息。
因此,相关企业开始争相开发人工智能与传统搜索结合的服务,需要首先用搜索工具来确定包含最相关材料的页面,然后使用自然语言“读出”它们。由此生成的结果会被注入OpenAI的GPT-3等大语言模型,给出更精确的答案。
聊天自然是海量语料的发源地,但这显然很容易涉及用户隐私保护,而市场从未放下对输入法泄露隐私的担忧,这让人们对微软SwiftKey输入法融入的AI究竟有多大吸引力打上问号。事实上,对于其他积极在输入法领域引入AI元素的科技企业而言,用户隐私保护同样是其立足的根本和底线。