vivo手机影像的未来方向,要靠生成式AI和3D模型了

2023-08-12 13:29    来源:卓越科技

时间进入2023年,尽管智能手机市场还在持续疲软,但手机厂商在产品竞争丝毫没有放缓,甚至在影像上还有增无减。更大面积的传感器、光学防抖、全焦段覆盖,高端智能手机的影像配置基本都上了一个台阶。

不过一方面,硬件上的提升容易带来同质化的竞争,很难拉开体验上的差异。另一方面,更豪华的硬件规格,也会影响到机身重量和内部空间设计,就比如小米13Ultra,在影像上确实带来了相当惊艳的体验,但同时,机身重量的增加和硕大的相机模组,都极大影响到了日常的手持体验。

所以在软件与算法等其他层面加大投入,几乎就成为了手机厂商一种的共识。但问题在于往什么方向做?又怎么做?

在7月底举办的2023vivo影像盛典特别活动上,vivo影像产品高级总监李卓表示,手机影像技术目前是三个领域同时走路:光学、算力、算法。

2023vivo影像盛典特别活动,图/vivo

具体到当前的技术背景下,光学到了一定瓶颈之后,突破起来难度非常大,可能需要材料学和基础物理的突破才行。但与此相对,一旦突破光学瓶颈就会带来全新的世界。二九目前,算力和算法带来的进步和突破则是非常明显。

从光学到算法,vivo一个都不想放过。

在3D模型里沉淀算法,在手机上应用算法

不久前,雷科技受邀参观了位于vivo重庆智能制造中心内的3D影像实验室。在vivo3D影像实验室,可以看到由175台单反相机,配合闪光灯、处理器、控制器和服务器组成的3D影像系统。

采集人体信息时,vivo3D影像实验室会同时调动174台单反相机从不同的角度进行拍摄,生成100余张2D图片(另外1台负责控制),随后通过局域网上传至存储服务器,再通过一连串的计算处理,最终生成一个3D模型。

vivo3D影像实验室内,图/雷科技

vivo在现场展示了整个流程以及生成的3D模型。尽管与实际「拍摄」的媒体老师还有明显的区别,但模型的精细程度也足以让在场观众感到些许惊艳。不过,这种方式显然不可能复制到智能手机上。vivo也明白这一点。

实际上,vivo的目的在于通过3D模型采集大量且精准的人体躯干与面部信息,不断优化算法,最终实现对智能手机影像的提高。

众所周知,传统的智能手机人像虚化算法,往往是在2D层面判断人的轮廓来实现虚化,不具备3D层面的深度信息,因此主体与背景之间的过渡往往比较生硬,背景也会缺少层次。

vivo希望能通过大量的3D模型进行预训练,让vivo的算法变得更加智能,让手机可以更好地判断人体的深度信息,使得人像虚化更加细腻与自然。

vivoX90Pro+拍摄的人像照片,图/雷科技

此外,3D模型的加入也让手机人像虚化算法应用范围可以进一步扩大。目前人像虚化算法由于缺乏深度方向的信息,只能拍摄全身像或是半身像,未来则可能拍摄眼睛的特写虚化画面。

而在3D模型之外,vivo3D影像实验室内还有一套「重打光」系统——由96个可编程的同步光源搭配工业相机,工作站以及服务器共同组成。这套系统可以模拟不同光照条件下的成像图片,为自研人像算法做数据支撑,提升手机上的算法效果。

3D模型计算处理过程,图/雷科技

但不同于iPhone上的「人像光效」,未来在加入重打光技术后,vivo手机可以对前期拍摄到的「逆光黑脸」进行高精度补光,调整光线的冷暖色温。甚至还能通过纹理重建与光照估计算法等技术,让用户基于自身喜好对光照、年龄、发型、表情等方面进行重新编辑。

「未来以算法为龙头,也并不是它自己往前跑,未来算法要去给传统的光学赋能,这是它里面的逻辑关系,」vivo影像副总裁于猛说。

我们有理由相信,这些技术应该会在不久后就能实现落地,而按照vivo工作人员的透露,它们将会在vivoX系列上率先应用。

不过vivo3D影像实验室的目的还不止于此。

未来的「影像」,未必是实拍

随着生成式AI的普及,手机和芯片厂商都在陆续加速相关技术投入。高通、荣耀强调了端侧AI大模型的概念,谷歌宣布将在下一款Pixel机型中加入最新的PaLM2大模型(壁虎版),华为也于最近宣布在鸿蒙4中结合了自家的盘古大模型,率先应用在语音助手小艺上。

vivo自然也不例外。不同的是,vivo想要抓住移动影像这个生成式AI的最佳「试验场」。

在海外,Midjourney、StableDiffusion以及DALL·E2(OpenAI旗下)都在绘画、图片等应用上取得了突破性进展。在国内,一款名为「妙鸭相机」的AI绘画小程序,也凭借精准的应用场景、较低的价格以及不俗的生成效果,迅速吸引了大量用户。

「妙鸭相机」用户体验,图/即刻@乌云花栗鼠

作为vivo布局3D影像技术的重要平台,重庆3D影像实验室通过搭建影视级光场系统,可重建出「毛孔级」人体3D模型,实现了更具真实感的高保真渲染视效。同时基于人像3D重建感知能力,vivo也在探索叠加AIGC算法,通过手机即可「拍摄」虚实结合更为自然的照片,实现「足不出户拍大片」的体验。

在参观3D影像实验室后的闭门会议上,vivo就展示一张由3D模型结合AI绘画能力生成的「照片」,画面里是一个极具真实感的赛博朋克世界以及人物。

vivo不允许拍摄,类似将一个人塞入《赛博朋克2077》世界。图/FunAcademy

不同于我们之前见过的AI绘画,借由工业级相机系统拍摄处理得出的精细化真人模型,vivo这张「照片」里的人物不仅足够真实,理论上各种姿势与动作也都可以比较完美地呈现。

某种程度上,你可以将其理解为「妙鸭相机」的进阶版,除了精细上的巨大优势,更核心的还是「人」。「妙鸭相机」利用20多张人像照片在大模型上进行训练微调,vivo则是直接拍摄计算得出的3D模型,更接近真人,适用范围也更广。

不过就像前文所提,这终究只能在实验室环境下产生,vivo最后还是要落地到手机等个人终端上,否则只能是空中楼阁。

另外值得一提的是,3D影像的相关技术可以应用在虚拟人应用上。包括近期比较火热的3D数字人直播、3D表情驱动、3D的虚拟场景编辑以及相应的动画制作等领域。而基于3D影像衍生的3D换装应用,可以根据采集者的人体模型,在虚拟场景内实现足球游戏,目前已经可以在vivo手机和平板电脑上进行演示。

无论如何,vivo展示了一种未来。未来我们的拍照方式或许被彻底颠覆,拍照不再是拍照,而是基于3D模型、生成式AI技术的一种新的创作方式。

举报/反馈



湿冷“魔法攻击”上线!南方遭今冬来最强雨雪 这份防抖指南请收好
科技

湿冷“魔法攻击”上线!南方遭今冬来最强雨雪 这份防抖指南请收好

本文转自:中国天气网 中国天气网讯 眼下,2024年首场寒潮天气正在影响我国,南方多地遭遇今冬来强度最强、范围最广的雨雪天气。今天(1月22日)早晨,最低气温0℃线已南压至贵州南部至江西北部一线,低温叠加雨雪,南方人熟悉的湿冷“魔法攻击”上线了,网友纷纷吐槽“南方的雨雪天冷到刺骨”。湿冷到底是一种怎 [详情]

周鸿祎称不能套用过去的模式看人工智能 大模型不是OS
科技

周鸿祎称不能套用过去的模式看人工智能 大模型不是OS

【CNMO新闻】在2023年1月21日的猎户星空大模型发布会上,360集团创始人周鸿祎分享了他对大模型应用前景的看法。他预测,2024年大模型应用将迎来巨大的机会,而企业级应用将成为其突破口。 周鸿祎强调,大模型与已有业务场景的结合将带来巨大的机会。随着技术的发展,越来越 [详情]

“听见”两会丨海南省政协委员何逸舟:建议搭建文旅服务区块链评价系统 助推海南文旅服务实现高质量发展
科技

“听见”两会丨海南省政协委员何逸舟:建议搭建文旅服务区块链评价系统 助推海南文旅服务实现高质量发展

点击查看更多视频 新海南客户端、南海网1月22日消息(记者 王燕珍)如何提升海南文旅服务水平和服务质量,助推海南文旅服务实现高质量发展?参加海南省政协八届二次会议的省政协委员何逸舟建议可搭建一个以区块链作为底层技术的评价系统,推动海南文旅服务生态的评价、反馈机制升级。  [详情]

雍禾医疗携手国内三甲医院展开合作 雍禾植发助力行业健康发展
科技

雍禾医疗携手国内三甲医院展开合作 雍禾植发助力行业健康发展

根据《都市人群毛发健康消费白皮书》调研显示,国内毛发医疗服务行业市场规模从2021年至2030年将以21.8%的复合年均增长率(CAGR)增长,2030年将达到1381亿元。市场前景广阔的同时,消费需求也在升级迭代。 此前,北京大学人民医院与雍禾医疗共建“北京大学人民医院X雍禾医疗毛发联合实验室”( [详情]

杭州3年引进731家首店,近半已销声匿迹
科技

杭州3年引进731家首店,近半已销声匿迹

都市快报讯 刚过去的2023杭州写字楼商业市场表现出了弱复苏状态。 近日,戴德梁行发布相关数据,并对杭州2023年整年度的零售商业市场及写字楼市场进行多维度的解读,并对2024年的发展趋势进行展望和预测。 “当下消费市场真正发生的既不是单纯的升级,也不是简单的降级,而是分层。顺应消费分层这一主流趋势 [详情]