未来的网购会是怎样的?
足不出户,就能看见商品的 3D 展示;不仅能把产品放大看细节,还能还原 1:1 的真实比例,放在房间的任何角落看看尺寸是否合适;甚至能把毛坯房用虚拟家具堆满,在装修之前就能确定新房的装修风格。
这一切看着很酷,不过总感觉离我们很远。
现在,淘宝入驻 visionOS 平台,把这些遥远的场景,拉进了现实。
淘宝×AVP,空间计算的第二条出路
在之前体验 Apple Vision Pro 时,我们认为只有观赛、观影、看演唱会等影像 App,才能把 visionOS 的应用生态盘活,让消费者为这项独有体验且可长期使用的功能买单。
现在,Vision Pro 有了新搭档——淘宝入驻 Vision Pro,很可能成为下一个 Vision Pro 的卖点,甚至会开启一种很细、很前卫的网购方式。
淘宝 Vision Pro 版上线后,我立马下载,并体验了一整个下午,比起网购,我更愿意说「我在 Vision Pro 里,玩儿了一下午淘宝」。
来到主界面,和手机/网页版的淘宝相比,Vision Pro 上的界面非常简洁:左侧「导航栏」、中间「商品区」、右下角「暂存坞」和「刷新键」一目了然。
没有任何多余的广告弹窗、分类和搜索栏,这也和淘宝 Vision Pro 的早期版本有关,现在我们体验到的类似于实验室版:功能不全,不能下单。
不过「轻享版」的淘宝,也带来了一种久违的舒适,让人能更专注商品的浏览。
导航栏共有四个选项,我挨个点进去看了看,发现每个都有亮点。
「首页」里面,从正面看上去平平无奇,一旦你切换视角,就会发现,右上角的无人机并不是平面图,而是一个悬空的 3D 模型,突破了平面网页的限制,十分逼真。
这是淘宝 Vision Pro 里最大、最核心的亮点——产品的 3D 展示和互动。
是的,只要在产品信息栏左下角标明了「3D」,你就能通过空间操作把产品随意拿捏。
以首页展示的无人机为例,点击了三维展示按钮后,你就能把它放在所在空间的任意位置。
放大或缩小,又或者放在桌面上。
在把物品放向桌面的时候,Vision Pro 会把可放置的平面用白色平面显示出来,并提示你松手,分开捏合的手指后 3D 模型就会掉落在识别平面上,经过实测,桌子、地面甚至手掌等都可以被识别。
这当中有几个令人惊叹的细节:
在把物品放落平面的时候,你会看到地面/桌面上,会有产品形状相对应的阴影出现,随着物品的上升和下降,阴影大小和深浅也会随之变化。
钢铁侠头盔表面金属光泽的反光,会根据房间中的光源反射,和房间中的真实物体的反射关系一致,从而融入了环境,让这个虚拟模型看起来跟真的一样。
把虚拟镜子摆在桌子上,你能从中看到镜子里面反射的是真实的环境,比如下图对会议室里窗户和电视的还原。
Vision Pro 对世界再现的真实感从何而来?其实就是把「本该如此」的常识再现出来。
而且,一些带有机械结构的商品,也能在 Vision Pro 的淘宝里打开。
烤箱开开后,放在厨房看看空间还够不够:
把钢铁侠的头盔打开,能一览内部结构,看看做工精美与否:
为了更好地展示产品,Vision Pro 为每个可以 3D 展示的产品定制了四项延伸功能。
360° 旋转
尺寸可视化
1:1 大小还原
同类产品对比
选中目标后自由旋转,一是你能从各个角度看到产品细节,还原度很高,GoPro 上的花纹、商标,都能展现出来;
二来能体验一把拥有「原力」的感觉,比如随意摆弄这台平时推都推不动的冰箱。
和前面的酷炫功能相比,尺寸可视化最实用,特别是遇到床铺、沙发、椅子这些大件,你没法儿确认它们摆在家里是什么样子?大小是否合适?颜色是否搭配?
把物体还原到 1:1 的大小,并显示出长宽高,能在下单前少走不少弯路。
宜家家居把家搬进了商场,边逛街边畅享未来家的模样;淘宝 Vision Pro 版把商场搬进了家里,多种搭配不停试错,直到找到最合适的那一个。
比如我看上的这张木床,就比下面的台阶长出一截,不拿尺子就知道得换个尺寸。
1:1 的还原,其实还有妙用:把网上的鞋子放在脚边,和现在脚上穿的款式进行对比。
只可惜目前还不支持空间穿搭,如果以后能把这些服饰、鞋帽直接在 Vision Pro 里穿在身上,空间计算版的「奇迹暖暖」将对 AR 换装技术造成降维打击,而且以 Vision Pro 的硬件和算力,这些都只是时间问题。
另一个惊喜功能是同类产品对比,把不同款式和颜色的商品放在一起对比选择,和真实的购物场景很像,加上能 3D 还原商品,对比结果就更有参考价值。
椅子的大小不太确定,颜色和样子有点纠结,那就和现实里的放在一起看看。
网图总是拍不出包包的真实大小,1:1 还原模型后,和手边的那一只比较一下,一目了然。
只要支持 3D,且有同类商品,就能得到最接近现实的产品展示。
由于主页的商品没有分类,如果你想找到指定产品,可以通过导航栏中的「搜索」找到。
目前,搜索功能支持打字、语音和识图输入。
实测下来,语音和识图功能的识别正确率都挺高,找到的产品也和想要的十分接近。
需要注意的是,搜索出来的产品不一定能 3D 展示,大概率会降级为网页版淘宝,和主页展示的有点区别。
效果惊艳,未来可期,当下……
以上的功能,我体验了一整个下午。
一方面,最熟悉的软件有了全新的打开方式,而且效果逼真。
淘宝 Vision Pro 版把所有二维图片立体化,通过 Vision Pro 强大的空间计算能力,让这些原本不存在的物品,真实地映射在我所在的房间。
而且 Vision Pro 对物体的还原很注重「细节」和「量化」,除了会标出具体尺寸数值,反映环境里的光影效果,还会用浅显易懂的方式,告诉你这个物体到底有多大,例如打开门的冰箱并不是空无一物,而是摆上了饮料和食材。
另一方面,把空间操作搬上淘宝其实很难用,我起码有 1/3 的时间,是在「误触-重启模型」二者之间反复横跳。
好不容易摆好位置、调好大小的 3D 模型,只因为手眼没配合好,而要全盘重来。
刚戴上 Vision Pro 打开淘宝的十分钟,很上头,不得不承认一点:Vision Pro 和淘宝在定义上非常契合。
适合在家里,不方便带出去,需要一定时间沉浸式地体验,二者的使用场景高度融合。
一开始我也是这么想的,认为 Vision Pro 终于找到了为数不多的「杀手级应用」:在网购和实物之间,搭建起了一座互通的桥梁。
但经过两三个小时的浏览后,这种念头被彻底打消,Vision Pro 依然是那个概念产品,而 visionOS 上的淘宝,也只是一个实验室功能。
从使用者的角度讲,Vision Pro 依然不适合长时间佩戴,大概一个小时之后,我就出现了眼胀头疼的症状,这和需要一定时间浏览的沉浸式网购,不太相符。
另外,「刷淘宝」这个动作,对于许多人而言有多种意义,这不仅是有需求才会打开的软件,浏览商品本身和刷抖音、看微博一样,是一种放松消遣的方式:躺着趴着坐着啥姿势都行,全身上下只有眼球和手指在动。
但 Vision Pro 不行,眼睛、脖子、手臂,甚至双腿几乎都要参与进来,沉浸感拉满,体力和精力也是。
并且别忘了,这是一台价值 3499 美元(约合人民币 25330 元)的昂贵设备。
对于普通消费者,用 Vision Pro 刷淘宝的成本(价格+使用),都太高了。
同时,对商家来说,适配淘宝 Vision Pro 版,也是一个不小的「工程」。
目前在主页适配 3D 展示产品,都是价格不菲、知名度不低的名牌、大牌产品,它们更有能力和资本去做这样的尝试,而对于很多中小型商户,如何适配?或者为何适配?都是未能解决的问题。
3D 展示很酷,沉浸式购物很新颖,但它只属于一部分商品的「特权」。大件家具、家电的确能在里面看到最直观的对比,但是如果只是买个茶叶或者文具,我找不到任何一个用 Vision Pro 购买的理由。
所以,在找到那个「比手机好用」的理由之前,淘宝很难成为 Vision Pro 的杀手级应用。
2020 年 8 月,三星 Galaxy Z Fold2 上架,此后折叠屏手机开始了一段高速增长期,虽然销量和市场占有率平平,但每家都在这之后推出了各自的高端折叠系列。
近四年过去了,我们看到折叠屏越做越轻薄,拍照越来越清晰,折痕越来越隐蔽,而软件适配,是所有人都没能答对的「最后一题」。
以折叠屏上的淘宝 App 为例,所有厂家都采用了「暴力拉伸」和「无脑平行视界」两种方案,淘宝几乎没有为任何一家厂商做过真正的适配优化,而其他软件供应商,也都一样。
2010 年 4 月,初代 iPad 推出,随之一起火起来的是专为平板而生的 HD 版 App,从排版布局到页面功能,都为平板做了适配化的设计。
现在,HD 版 App 所剩无几,即使依然存在的也无法和 PC 端、移动端的功能相提并论;在折叠屏上,应用厂商甚至直接放弃了适配,照搬原有一切从简。
开发成本、受众规模、维护费用等前期投入和后期收益完全失衡,平板 OS、折叠屏 OS 也从当初的单独立项,逐渐衰退成了停止更新、应用下架,甚至不再开发。
淘宝 Vision Pro 版也是如此,比起平板和折叠屏的用户规模,Vision Pro 更加凄惨。
就和「招商银行 App」上架 visionOS 类似,你能指望空间支付、空间还款给你的生活带来什么质的变化么?
适配 visionOS,应用厂家更多的考虑是秀肌肉、秀态度,展示自己的技术实力。
对于「空间支付」的招商银行如此,对于「空间购物」的淘宝也一样——象征意义大于实际意义。
新技术的到来总是让人兴奋,我们也在这种情绪里习惯于高估短期效益,低估长期效益。
2008 年,诺基亚首款触摸屏手机 5800 XpressMusic 上市,由于单点触控和电阻屏的技术限制,也没人认为全面屏会比按键机更好用。
visionOS 版淘宝,带来了全新的、挑战使用习惯的交互体验,短期内噱头大于实用性是必然的结果,但它的长期价值,以及对未来人机交互范式的探索,或许不容小觑。