谷歌安卓16打造端侧AI智能体:Gemini将成管家,代用户掌控应用交互

虽然理论上Gemini可通过屏幕阅读、多模态AI等技术控制任何应用,但效果并不理想。
点击收听本新闻
听新闻

IT之家 11 月 22 日消息,科技媒体 Android Authority 昨日(11 月 21 日)发布博文,报道称谷歌正为安卓 16 系统开发全新 API,可以让 Gemini 代表用户,操作其他应用交互。

现状

IT之家援引博文介绍,谷歌希望将 Gemini 打造成手机上的真正 AI 智能体,实现谷歌曾对 Pixel 4 的 Google Assistant 许下的承诺。

Gemini 目前主要通过扩展程序,访问 Google Flights、Google Hotels 等网络服务,从而在用户提出相关问题后,从中提取数据并回答相关问题。

但这种方式扩展性有限,难以覆盖海量 Android 应用。虽然理论上 Gemini 可通过屏幕阅读、多模态 AI 等技术控制任何应用,但效果并不理想。

进化:从扩展到 API

这个新 API 的核心是“应用功能”(app functions),应用开发者可以通过定义服务来创建相关功能,并将其分享给 Android 的 App Search 框架。

“应用功能”具有唯一标识符,例如“orderFood”,系统应用可以通过 EXECUTE_APP_FUNCTIONS 或 EXECUTE_APP_FUNCTIONS_TRUSTED 权限执行这些功能。

EXECUTE_APP_FUNCTIONS

EXECUTE_APP_FUNCTIONS_TRUSTED

其中 EXECUTE_APP_FUNCTIONS_TRUSTED 权限具有更高的安全级别,应用开发者可以选择仅允许拥有此权限的应用执行其功能。

打开APP阅读更多精彩内容