AI流程自动化软件Zapier,如何通过Copilot颠覆传统人机交互

大模型火了以后,好像一夜之间Chatbot变成了人机交互的最佳方式,GUI(Graphic User Interface)最终会被淘汰,一系列所谓原生AI应用,都以CUI(Conversational User Interface)作为标准交互范式。

对此,我持有反对意见,具体观点在AI时代,CUI会替代GUI么?中有讲到。

其实,从GUI到CUI之间,有一个过渡性(或者叫中间形态)模式,就是Copilot(注意这不是指微软的语音助手),智能副驾驶。

所谓智能副驾驶,是当你在使用GUI模式的应用系统时,可以有一个智能助手,需要的时候,助手可以无缝介入软件的操作,帮助你辅助决策,甚至直接操作功能,完成工作。

Copilot不是一般意义上软件智能助手,或者问答机器人。后者只能提供对话交互,并不能操纵软件。Copilot具备呃直接操纵软件的能力,从某种程度来讲更像一个Agent。

企业软件应用领域,AI目前并不能真正替代人,但Copilot的模式,可以很好的将碳基人和硅基人进行融合,一方面利用了AI的智能辅助能力,另一方面保持了人的决策判断能力,相辅相成。Copilot是目前我认为比较合理的AI在人机交互领域的最佳实践。

我们之前拆解过了编程辅助工具Cursor和Agent,Cursor的Agent模式,Windsurf的Write模式,就是典型的Copilot,你可以通过自然语言描述来完成人机交互和程序编写。但编程领域比较特殊,Copilot作为一个Agent处理的是文件,而非控制GUI。那么,有没有Copilot能帮助用户操纵控制软件呢(非RPA侵入方式)?答案是肯定的。

Cursor右侧的Write模式的Chatbot就是一种Copilot

接下来要介绍的就是今天的主角,Zapier,这是一家12年成立于美国的公司,最早是做SaaS模式下的流程集成和自动化,这两年开始融入AI能力,23年营收已达到3亿美元。

我第一次听到Zapier这款软件,是来自明道云任总的文章生成式AI和传统软件的分野和融合(全文),看到介绍后,就很有兴趣。最近花了一些时间进行研究,实现了一些功能。

Zapier的核心功能,是内置了非常丰富的集成接口,覆盖了欧美绝大多数主流SaaS软件,可以做跨系统流程集成和工作流编排。

例如,你可以实现类似:当官网有一个客户提交了线索,通过Zapier将线索分配给某个销售,再给这个销售发一封通知邮件和一条Slack消息,并且在Salesforce中创建一个线索记录以及待跟进任务,同时给销售主管的Notion中发一个待跟踪任务和一条Slack通知。

然而,Zapier让我感到好玩的不是标准功能,而是其尝试探索了Copilot的人机交互模式,并且是目前我用过的相关软件中,能力最强,体验最好的一款。

让我们一起来看看软件功能。

首先,Zapier的几个核心功能,Zap是工作流,Table是数据表(类似于Airtable的基础数据表定义),Interface是界面编辑器(可以生成表单),Chatbot用来定义聊天模式的Agent(可以内置集成Zap),以及Canvas(这个后便会进一步介绍)。

Zapier的主界面,首先这个主界面就清晰、整洁,体验非常好!

Zapier推荐通过CUI的方式尝试创建流程

根据文本描述,Copilot自动分解任务,这也是Zapier最强的地方,他并不会直接创建流程,而是会给你选择,你可以初步调整、编排你的任务,确认后再提交,由Copilot自动创建流程节点。

进入工作流编排界面后,Copilot会继续存在,依然可以完成任务的分解、调整。

每执行完一个步骤,Copilot会对任务打钩,当然不是所有任务节点都会完整创建,很多细节配置依然需要再GUI完成

对配置完成的流程,可以进行测试。既可以在GUI完成,也可以在Copilot完成。

如果测试中出现了错误,节点编辑组件会进行错误原因定位和分析,我个人觉得这个错误信息可以放在Copilot中,并尝试自动修复,这样体验连续性可能更强。当然现在的设计也很好用!

目前Zapier还不能直接修复错误,但给出的修复建议基本准确,不是泛泛的方法,而是具体到字段级别的诊断。

Zapier的Copilot,虽然还有待完善,比如不能识别我用语言描述的循环逻辑,但是作为业界对Copilot的探索,已经足够惊艳!

首先,在一个BS架构的软件中,聊天对话框可以创建任务控制GUI中的控件,这就很神奇,而且更神奇的是,当你通过键盘鼠标操作GUI的时候,Copilot还能识别一些变化。

要知道,这并不是类似于RPA采用了界面截屏识别的技术能力,而是对前端控件进行了组件化处理,Zapier一定是对控件进行了函数封装,并且集成了丰富的上下文和回调接口,从而让用户的人机交互可以被Copilot感知。这可是不小的工作量!

除了流程编辑器,Zapier还提供了Table和Interface。如果从软件的三层架构MVC(Modeling,View,Controller)来讲,Zap实现的是业务逻辑层C,Table定义了数据层M,Interface(这里是界面的意思,不是接口的意思)定义了View。

Zapier的Table说实话比Airtable等低代码软件还是弱很多,当然这是因为Zapier的定位并不是低代码产品。

Zapier的界面编辑器,中规中矩。

Zapier的大模型节点编辑组件我觉得是目前最好用的。首先输出数据是一个非技术人员能理解的呈现,而不是简单粗暴的json。

其次,根据大模型返回的内容,编辑器可以自动生成一组结果变量集合,对应大模型的输出,这就很方便了。

Zapier还有一个特别强的功能,叫做Canvas。你可以把Zap理解成一个一个API的定义,而Canvas可以把API、表单、数据表这些东西全部串起来。

例如,可以用Canvas实现以下功能:通过Interface创建一个Form,用户提交表单后再Table生成存储一条数据,然后调用Zap封装的API来用Slack通知销售并把数据传递到Salesforce。

Canvas同样也可以以CUI的职能方式描述需求来创建整体画布。

用文字描述一个业务过程,Canva会自动拆解任务,创建表单、数据表、工作流。

业务流程在Canvas中被绘制出来。

对于工作流自动化应用产品,我还体验了几个同类竞品,比较知名的有n8n。n8n是2019年成立的团队做的项目,可以私有化部署,源代码公开,n8n没有copilot,没有人机交互,功能更强,更难用,适合有一定研发能力的企业应用,Zapier面向个人或中小企业,灵活性强,使用简单,非技术人员友好。以下是一些界面截图。

n8n的功能强悍,但上手困难!除了流程节点,还有多个预置的AI节点,数据处理节点。

n8n的节点配置器,看着我都头晕。。。。

第三方给出的对比

作者 | 杨堃 ; 编辑 | 虾饺

打开APP阅读更多精彩内容