您当前的位置:首页 > 电脑百科 > 人工智能

AI“百模大战”风向变了?360、美图先后出招,视觉大模型上演“神仙打架”

时间:2023-06-22 14:49:26  来源:视觉大模型  作者:

来源:华夏时报,记者赵奕 胡金华 上海报道

 记者赵奕 胡金华 上海报道

  随着AI大模型研发应用热潮持续高涨,记者注意到,赛道内的玩家开始将重心从语言大模型转向视觉大模型。近期,Adobe、Meta、360、美图等多家国内外互联网头部企业纷纷发表大模型成果,为本就火热异常的AI市场再添了一把火。

  “人工智能在视频领域的应用越来越受到重视。”中国通信工业协会两化融合委员会副会长吴高斌向《华夏时报》记者表示,这些大型AI模型的发布为企业间的竞争带来了新的动力。企业之间的竞争将促进技术创新和进步,同时也将带来更好的产品和服务。竞争还将促进企业间的合作和共享资源,从而更好地满足市场需求。

  海内外视觉大模型“神仙打架”

  在鳞次栉比的语言大模型、多模态大模型纷纷涌现之后,“视觉大模型”成为又一个兵家必争之地。日前,美图发布AI视觉大模型MiracleVision,一同发布的还有AI视觉创作工具WHEE、AI数字人(11.540-0.04-0.35%)生成工具DreamAvatar、美图AI助手RoboNeo等7款产品。

  据介绍,MiracleVision具有强大的视觉表现力和创作力,能从绘画、设计、影视、摄影、游戏、3D、动漫等视觉创作场景反推技术演化。与市面上其他大模型不同,它尤其擅长亚洲人像摄影、国风国潮、商业设计等生成方向。

  美图公司创始人、董事长兼首席执行官吴欣鸿在接受《华夏时报》记者采访时表示:“美图大模型的核心优势是‘懂美学’,C端用户基础足够大,大模型冷启动的获客成本低,美图目前有2.43亿的月活用户,全球VIP会员数为719万,能在短时间去验证产品成功与否。不同于其他厂商,美图大模型聚焦于美学(画面画质设计等),未来如果非要竞争,会在美学上面去‘卷’。”

  无独有偶,360也日前正式发布“360智脑-视觉大模型”。 360创始人周鸿祎表示,大语言模型是构建视觉大模型的基础,多模态能力增强的核心是借助了大语言模型的认知、推理、决策能力。同时,视觉大模型也是“360智脑”的重要能力组成,能够看懂图片,未来还能看懂视频、听懂声音。

  海外企业也已经开始在视觉大模型上布局。日前,社交媒体巨头Meta宣布,将向研究人员开放一个名为I-JEPA的“类人”人工智能模型的部分组件,该模型可以比现有模型更准确地分析和完成未完成的图像,而不是像其他生成式人工智能模型那样,只根据附近的像素进行推断。

  Meta公司首席人工智能科学家杨立昆曾公开指出,当前的GPT自回归模型存在缺乏规划、推理的能力,未来GPT系统或将被抛弃,并给出了他认为的正确答案——世界模型。据称I-JEPA是第一个基于其愿景关键组成部分的AI模型,能比现有模型更准确地分析和完成未完成的图像。

  除此之外,Meta还发布了语音生成AI模型“Voicebox”,支持从文本中生成语音,能够根据仅两秒长的样本匹配音频风格,并将文本样本转换为另一种语言,在给定单独的语音样本的情况下,并能够以说话者的原始语音朗读翻译后的文本内容,目前支持六种语言:英语、法语、德语、西班牙语、波兰语和葡萄牙语。

  而早在今年4月,Adobe便将其Adobe Firefly功能(类ChatGPT产品)集成在Premiere Pro、After Effects、Audition、Remix等音视频产品矩阵中,为用户提供一键生成内容、剪辑、调色、更换音乐等功能。

  从“语言大模型”到“视觉大模型”

  《中国人工智能大模型地图研究报告》显示,从全球已发布的大模型数量及分布来看,中国和美国大幅领先,超过全球总数的80%。同时,欧洲、俄罗斯、以色列等越来越多的研发团队也在投入大模型研发。但值得注意的是,我国在计算机视觉等领域的大模型还较少。

  究其原因,北京智源研究院访问首席科学家颜水成向《华夏时报》记者表示:“现在视觉模型发展稍微滞后的主要原因,是因为视觉大模型吃算力吃得比文本要大很多,所以我们也期待芯片更快速的发展,甚至有可能把非GPU其他的芯片融合在一起来做。现在大家见到的模型一般千卡级比较常见,但可能明年就有人会用万卡级来做。”

  而在北京智源人工智能研究院院长黄铁军看来,视觉领域是大模型领域下一个浪潮的重点。他指出,视觉大模型和语言大模型背后的思想方法和基本路线是异曲同工的,只是输入的数据变成了图像和视频,训练出来的模型则具有一定的通用视觉语言能力,一种是之前提到的AIGC(人工智能自动生成内容),可以生成图像和艺术品,“还有一种更基本的能力,就是看到世界之后,得首先能把这个世界(万物)分清。”

  对于视觉大模型的发展,不少机构也表达出看好的态度。中金研究发布的研报认为,计算机视觉未来有望实现更高程度的自动化、高精度和低功耗,进一步丰富元宇宙的内容生态,降低进入门槛。计算机视觉的进步引领了三维重建和动捕技术快速成熟,并逐渐在各自的领域积累技术进步。计算机视觉未来有望迎来更高程度的自动化、更高的精度,以及更低的功耗,逐渐在移动端实现更好的视觉效果,被应用在大量下游行业,逐渐迈向连接物理世界和数字世界的长期愿景。

  中信证券研究也表示,在设计领域,大模型引领数字设计走向智能设计,相关工业设计软件结合GPT等技术,可应用在设计规划、布局优化、插件助手、草图绘制等场景,工业设计软件有望在AI升级的大趋势下迎来新一轮生产力革命。



Tags:视觉大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
你知道什么是视觉大模型吗?
视觉大模型是近年来人工智能技术中备受关注的一种技术,它可以模拟人类视觉系统的工作原理,对图像进行分析和处理,并通过机器学习不断优化自身的算法。然而,对于普通人来说,视觉大...【详细内容】
2023-06-28  Search: 视觉大模型  点击:(189)  评论:(0)  加入收藏
AI“百模大战”风向变了?360、美图先后出招,视觉大模型上演“神仙打架”
来源:华夏时报,记者赵奕 胡金华 上海报道  随着AI大模型研发应用热潮持续高涨,记者注意到,赛道内的玩家开始将重心从语言大模型转向视觉大模型。近期,Adobe、Meta、360、美图等...【详细内容】
2023-06-22  Search: 视觉大模型  点击:(177)  评论:(0)  加入收藏
美图发布7款AIGC产品 包含懂得美学的视觉大模型
6月19日,美图公司举办以“AI时代的影像生产力工具”为主题的第二届影像节,现场发布7款新品:AI视觉创作工具WHEE;AI口播视频工具开拍;桌面端AI视频编辑工具WinkStudio;主打AI商业设...【详细内容】
2023-06-19  Search: 视觉大模型  点击:(171)  评论:(0)  加入收藏
▌简易百科推荐
行业大模型快速落地的一年,如何做?
生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看,无论是“文生文”的大语言模型,还是“文生图”的多模态模型,更多的是辅助人们进行一些简单的办公,或者提供一...【详细内容】
2024-04-10    钛媒体APP  Tags:行业大模型   点击:(3)  评论:(0)  加入收藏
互联网充斥“针对小白的AI课”,能相信吗?普通人不学AI课程会被淘汰?
早前,一位标榜清华大学博士和多家公司AI顾问名头的百万级粉丝量博主,向用户大力推介“所有人都需要学”的AI入门课程。不过,这些课程最终因贩卖焦虑、蒙骗学员而被平台下架。然...【详细内容】
2024-04-10    九派新闻  Tags:AI课   点击:(5)  评论:(0)  加入收藏
藏在AI背后的“吃电狂魔”
人工智能时代的能耗黑洞据估算,到2027年,人工智能行业每年将消耗85~134太瓦时的电力,相当于瑞典或荷兰一年的总用电量。马斯克判断,电力缺口最早可能会在2025年发生,“明年你会看...【详细内容】
2024-04-09    雪豹财经社  Tags:AI   点击:(3)  评论:(0)  加入收藏
OpenAI和谷歌再起纷争:AI的尽头是内容
日前,纽约时报的一篇报道称,人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频,也...【详细内容】
2024-04-09  小编也疯狂  新浪网  Tags:AI   点击:(3)  评论:(0)  加入收藏
AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
财联社4月7日讯(编辑 史正丞)种种迹象显示,目前站在全世界AI领域潮头浪尖的这些公司,早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】
2024-04-09    财联社  Tags:AI产业   点击:(4)  评论:(0)  加入收藏
和“数字人”交朋友,当心隐私被出卖......
在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验?如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点?《中国消费者报》记者就此展开了调查APP里有个...【详细内容】
2024-04-09    中国消费者报  Tags:数字人   点击:(6)  评论:(0)  加入收藏
AI“复活”成产业链:成本可降至数百元
大模型应用落地,带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳 实习生 孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前,预估会有需求的庞立...【详细内容】
2024-04-09    中国企业家  Tags:AI“复活”   点击:(3)  评论:(0)  加入收藏
多方热议人工智能产业新机遇
编者按  从前沿科技展会到高层对话平台,从上海、重庆到博鳌,从线上到线下……一场场高规格、大规模的盛会中,人工智能正在成为各界热议的高频词。赋能千...【详细内容】
2024-04-08    中国家电网  Tags:人工智能   点击:(5)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08    中国青年报  Tags:​人形机器人   点击:(6)  评论:(0)  加入收藏
AI重塑社交:腾讯与字节跳动的新赛场
文|新火种 一号编辑|美美最近,腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品,尽管腾讯和字节跳动在前段时间刚刚“破冰”,但这一举措不仅意味着这两大巨头之...【详细内容】
2024-04-07    蓝鲸财经  Tags:AI   点击:(8)  评论:(0)  加入收藏
站内最新
站内热门
站内头条