4 月份,Genspark 超级 Agent 上线,因为 AI PPT 的能力小小地出圈了一下。这个时候,Manus 正因为 AI 浏览器爆火。眼下,刚过去两个月,Genspark 也推出了自己的浏览器。
实际上这已经是 Genspark 第二次转变产品思路。 在 2024 年刚推出的时候,Genspark 主要的方向还是 AI 搜索 。到 2025 年的时候,Genspark 开始果断放弃 AI 搜索,转向 AI Agent,尽管此时他们已经积累了 500 万用户。Genspark 做出这项决策的最主要原因是他们判断,传统 AI 搜索流程固定,无法应对复杂任务。
这多少反映了 AI 行业的快与卷,一旦不及时调转船头改变方向,就很容易落后,例如去年风头很劲的新 AI 六小龙,今年多少都有些失意。
Genspark 公司发展历程|极客公园
Genspark Super Agent 的成绩还是很不错的,上线 45 天其 ARR 就已经达到了 3600 万美元。当然,需要指出的是,ARR 这个现在 AI 公司很流行的指标是有些鸡贼的。ARR 指的是年度经常性收入,过去常用于衡量 SaaS 公司的财务状况。我们可以简单把它看成是这家公司一整年的订阅收入,算法也可以简化成「月订阅收入×12 个月」。所以 Genspark 的 3600 万美元并非实际收入,而是按照当月收入预测出来的全年收入。
如果以 Genspark 每月 25 美元(约合 180 元人民币)的订阅费计算,那就是有约 12 万人付费订阅了 Genspark。
业内认为,Genspark 团队是生生靠「卷」做到了反超 Manus 一步。那么,推出了 AI 浏览器,会是 Genspark 团队「逆袭」的重要一步吗?
01
确实是生产力小能手
从能力上看,我会把 AI 浏览器分为两类。
一类是传统浏览器+AI 助手,我称之为「被动式 AI 浏览器」。这类浏览器通常需要用户主动发起问题。AI 所负责的,是信息的检索和归纳,代表就是最近刚刚加上 Gemini 对话的 Chrome。
另一类 AI 浏览器更加「AI native」, 它们有更多的权限访问你的数据,并以此展开更多动作,相当于多了「眼睛」和「手脚」。
像 AI 搜索、文生图、文生视频这些基础的能力 Genspark 当然也具备,但它最强大的能力还是在解决复杂问题的能力上。这考验了 AI 在内部分解问题、制定计划并在最少的监督下逐步执行计划的能力。按照这个思路来看,Genspark 颇有一些亮点。
初次打开 Genspark,你首先要做的就是让 Genspark 更了解你,例如昵称、职业、个人资料、你希望 Genspark 具备的特质等等。这样 AI 就可以根据你的个人信息给出更个性化、更准确的回复。
但最厉害的是「自动研究」这个按钮,粘贴你的 Linkedin、Twitter 或者任何跟你个人相关的网页,Genspark 就能根据你的历史数据自动生成一份画像 。
提交你的社交网络账户,Genspark 可以「自动研究」,从而生成更符合你个人的回答
基于「眼睛」和「手脚」的能力,Genspark 做了一些其它有意思的功能。
例如 Find Best Deal。当你在购物网站看中某款商品时,Genspark 会自动搜寻全网最低价,并给出选购建议。
Genspark 会把结果输出成一张表格,甚至 eBay 上的二手价格它也会考虑
还有电话代打。这不是 AI 自动回复打进来的电话,而是你可以让 Genspark 去跟真人打电话。官方给出的用法是你可以预定参订或者查询某个商店有没有存活。
但是有的日本用户发明了邪道玩法。 一些日本用户用它来打电话辞职——他们不喜欢公司,不想再给公司打电话了;还有一些人用 Genspark 来跟男朋友或女朋友分手 。
不过,比较遗憾的是,受限于网络环境,这些跟「现实世界」交互的功能在中国还无法使用——你没法比较淘宝上的商品,也必须亲自跟女朋友打电话分手。
生产力方面,Genspark 的视频总结和 PPT 能力让我印象非常深刻。对于一些信息密度高的视频,Genspark 不但可以总结视频内容,还可以以此为基础生成一份 PPT。
例如,我让 Genspark 根据张小珺在 Youtube 上的一期播客「94. 逐篇讲解 DeepSeek、Kimi、MiniMax 注意力机制新论文——『硬件上的暴力美学』」,生成了一份 12 页的 PPT。
可以看到 Genspark 梳理出了一个非常清晰的结构,有各家公司论文的特点,有对比和分析,还有一个总体的总结 。PPT 的视觉效果也完全处于可用的状态,不说多么优秀,已经比很多 PPT 新手强了。而这一切都是 AI 在短短几分钟之内做到的。尽管我没有完整地听完这个长达两个半小时的播客,但已经很快地大致了解了这 3 家公司注意力论文的特点。
Genspark 总结长视频内容,生成 PPT|图片来源:Genspark
与此同时,跟 Genspark 的另外一个功能「 为我下载 」联动,输入提示词就可以非常方便的下载视频中提到的论文。
「自动下载」可以直接下载视频中提到的内容|图片来源:Genspark
当然,这份 PPT 也存在一些问题,例如某些设计元素的过度使用,或者是一些表格上设计得不太讲究。
2023 与 2024 年间距过近,文字部分也存在重叠|图片来源:Genspark
这个时候可以选择使用内置的编辑器修改,或者将 PPT 导入到 Canva、Figma 中做更专业的修改。
Genspark 生成的 PPT 可以直接修改|图片来源:Genspark
Genspark 在表格方面的能力也很强大。这个功能的官方示例是让 Genspark 查找 20 个关于 Genspark 的 YouTube 视频、总结观看指标,并突出显示正面和负面的用户评论。可以看到 Genspark 罗列的数据都非常清晰,负面评论也很有代表性,没有因为涉及自身而有所回避。
Genspark 批量分析 Youtube 视频|图片来源:Genspark
你还可以上传 PDF 格式的产品报告,让 AI 自动提取关键数据,并生成相关的洞察分析。
Genspark 分析 PDF 格式产品报告
或者是让 Genspark 自动比较巴黎、罗马、阿姆斯特丹的 7 天旅行方案,并生成一个表格。
能考虑到「推荐季节」和「语言难度」,真的很细心了|图片来源:Genspark
收费方面,Genspark 提供每天 200 免费积分,可以试用一些功能,但是对处理复杂任务来说就完全不够了。稍微重度一点的用户,可以订阅每月 25 美元的套餐,包含了 10000 积分和所有最新大模型的访问权限。
如果能把 25 美元定义为「生产力工具的租金」的话,这笔钱就花得值
别心疼订阅费,一些脑子活络的用户已经开始用 Genspark 赚钱了。一位 SEO 专家 Julian Goldie 在 Reddit 上分享,他用 Genspark 在 15 分钟内就构建了一个原本需要 3 周开发时间的定制 SEO 工具。第二天,他就交付给了客户,赚了 2500 美元,可以订阅 Genspark 10 年。
就在我体验 Genspark 的过程中,它又推出了 AI 文档功能,凭一句提示词就可以生成调查问卷、餐厅菜单 、简历等等。
至此, Genspark 已经完成了 PPT、表格、文档这 Office 三件套的搭建 。很显然,Genspark 把目标用户瞄准了付费意愿最强的一群人。
AI 文档的生成基本涵盖了工作中的各种高频刚需文档
从 Genspark 的产品形态来看,这是一家快速迭代、同时路线非常明确的公司。
在积累 500 万用户的时候果断放弃 AI 搜索,转向复杂任务的解决,因为 AI 搜索这种简单的能力很容易被淘汰。接着做出超级智能体,秀肌肉的同时也是验证技术方向。到现在接连推出 AI 的 Office 三件套,就是面向付费意愿最强的用户,解决他们真实的问题。
当然 Genspark 也不是没缺点。这应该是一家工程师文化很强的公司,新功能的迭代速度很快。但带来的结果就是 界面有些杂乱,或者说不够优雅,例如官网首页大面积的 AI 播客信息流 。
这些「为你推荐」仿佛是门户网站时代的遗产
对于初次进入 Genspark 的用户来说,他们可能不太知道要做什么。很多好的功能都有一定的学习曲线,需要更好的引导与说明。
而对于更深度的用户而言,历史记录的功能也有些难用。我往往需要经过很多极菜单、打开了好几个网页之后,才能找到某一份 AI 生成的 PPT。
这其中,有一些用户友好的问题可以很快解决掉,但是更根本问题还是指向——AI native 的 App 到底应该是什么样子。这个问题没有答案,整个业界也都在思考。
Genspark 总结自己的所有功能
02
为什么是浏览器
AI Agent 的之后,AI 浏览器已经变成了当下最热门的赛道。Manus、Genspark 这类初创公司自不必提,腾讯的 QQ 浏览器、阿里的夸克、字节的豆包,以及 Edge、Chrome 这些老牌浏览器,都或多或少在向 AI 浏览器的形态迁移。
为什么是浏览器?
首先,它是互联网时代的入口。回顾一下历史,入口生意实在是一门好生意,每一个过路的人都自然而然地会上缴过路费,每一个把持着入口的公司在今天都是几万亿市值的科技巨头。互联网时代是拥有 IE 浏览器的微软、Chrome 的谷歌,移动互联网时代是苹果。直到今天, 谷歌公司绝大部分收入都还是通过搜索引擎的广告模式带来的 。
尽管今天绝大部分用户的注意力已经被手机所攫取,但是回归到生产力领域,桌面平台几乎还是唯一选择。
而新技术——大模型的出现,给新玩家带来了可能性:「也许,我们可以颠覆掉这个领域的巨头 Chrome」。
但, 我可能还是会继续使用 Chrome 。
首先是习惯。养成一个习惯需要 21 天,即使我起心动念想要迁移到某个新浏览器,这 21 天中的每一秒我都有可能放弃。类似的情况并不是没有发生过,我一度尝试过迁移到 Edge、Arc 以及 Dia。但是当我某一次偶然打开 Chrome,那种行云流水的熟悉感又回来之后,Chrome 就又变回了我的默认浏览器。
其次,AI 行业的变化实在太快了。眼前这个 AI 浏览器有些功能真的做得很好,但你不知道明年这家公司是不是还活着;下个月是不是会有更强大的竞争对手出现。我的历史数据、插件、账号密码这些都会成为迁移的成本。
但是归根结底,现在的 AI 浏览器还不够好。不是比 Chrome 好上一点点,而是破坏式的好,是 iPhone 对诺基亚的那种好。
与此同时,Chrome 也不是诺基亚,它并不差。它的困境,与技术、资金这些都没有关系,而是在于自己的历史包袱。