AI“长眼”,谷歌推出Gemini实时视频功能

实时视频功能允许Gemini实时解读智能手机摄像头的画面,并回答相关问题。

图注: Gemini实时视频功能

图注: Gemini实时视频功能

凤凰网科技讯 北京时间3月24日,据科技博客TheVerge报道,谷歌发言人亚历克斯·约瑟夫(Alex Joseph)证实,该公司已开始向其语音模式Gemini Live推出新的AI功能,使其能够“查看”用户的屏幕或通过智能手机摄像头观察并实时回答相关问题。

这些功能由谷歌多模态虚拟助手项目“Project Astra”提供支持。接近一年前,谷歌首次演示了Project Astra项目的相关成果。

一位Reddit用户表示,他们的小米手机上出现了这一功能。周日,这位用户发布了一段视频,演示了Gemini的新屏幕阅读能力。这是谷歌在3月初宣布的两项功能之一。该公司当时表示,这些功能将在当月晚些时候向Gemini高级订阅用户推出,属于Google One AI Premium计划的一部分。

谷歌推出的另一项Project Astra项目功能是实时视频,它允许Gemini实时解读智能手机摄像头的画面,并回答相关问题。在本月谷歌发布的演示视频中,一位用户利用该功能向Gemini询问,哪种颜料颜色更适合他们刚上釉的陶器。(作者/箫雨)

更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。

打开APP阅读更多精彩内容