学而思还没有上线的数学大模型MathGPT和作文AI助手近日陷入了争议。
6月13日、14日,学而思的作文素材产品合作方笔神作文两次发文,指学而思在短短一个周末的时间,用爬虫爬取其作文素材库达200多万次,盗取了公司的作文库存。
学而思爬取合作商作文素材?
6月13日,笔神作文在公众号和微博发文称,学而思在今年4月13日至4月17日,通过“爬虫”技术非法访问、缓存笔神作文APP服务器数据多达258万次。
笔神作文认为,这一行为不仅违反了双方的合同条款,也违反了《数据保护法》相关条款,严重侵犯了笔神作文APP的数据权益。
资料显示,“笔神”和“笔神作文”是隶属于北京一笔两划科技有限公司的品牌。该公司主要利用人工智能技术,帮助写作者提升写作能力。
工商信息显示,A股上市公司世纪天鸿(300654)是北京一笔两划公司第二大股东,持股比例18.47%。此外,搜狗旗下北京搜狗信息也持有公司15.5%股份,系第三大股东。此前,该公司还曾获得真格基金投资。
笔神作文在官网发布的产品介绍显示,其拥有千万级写作素材库。在写作过程中,可以基于用户所写内容实时推送素材,帮助持续高效地写作。
笔神作文与学而思之间有着多年的合作关系,这也成为双方此次纠纷的导火索。
笔神作文表示,“在合作刚开始时我们抱着促进教育发展的心态,为这位‘战友’提供作文素材查询服务。我们甚至还考虑到双减政策下教育行业生存不易,将合同中约定好的服务费调整为三分之一。”
“然而学而思却利用了我们的这份信任,利用了我们对合作伙伴的接口不设防。从4月13日开始在后台频繁、高密度地爬取我们的数据。直接登堂入室,盗取了我们的作文库存。”笔神作文称。
笔神作文还表示,4月公司的作文库数据被“窃取”,5月学而思的作文AI助手新产品就即将上线,未免过于“巧合”。疑似指学而思作文AI产品使用了其技术或素材。
对于笔神作文这一声明,证券时报·e公司记者通过公开电话多次联系公司,截至发稿未获回复。
双方各执一词
笔神作文在声明中提到,希望学而思就此支付1元赔偿金,并公开道歉,同时删除已爬取的数据。
不过,6月13日晚,学而思就此回应称,公司对笔神作文接口的调用,属于合同约定的正常合作范围,对笔神素材内容的使用均符合合同要求,并未用于合同以外的任何用途。
声明提到,学而思和笔神作文于2020年12月开始合作,合作协议明确约定:笔神作文为学而思提供“笔神作文范文素材服务接口”,用于学而思相关服务中,每月保底费用包含的调用次数为百万次量级。合作至今,双方一直按照调用量进行正常结算。
对于笔神作文暗指学而思AI产品使用了其数据,学而思表示,笔神作文主观揣测公司使用其数据用于两款产品的训练和研发,这与事实严重不符。
“首先,MathGPT是专注于数学领域的自研大模型,没有任何作文相关数据;其次,作文AI助手目前处于开发状态,尚未发布,该服务并未使用笔神作文的任何数据。”
不过,6月14日晚,笔神作文再次发文称,“学而思”在声明里提到调用数据为正常使用,但在2023年4月13日至4月17日之间,公司检测到服务器接口出现大量有规律的异常访问,导致服务器承载压力快速升高。
通过查阅服务器日志发现:三体云联公司(学而思关联公司)未经一笔两划公司授权许可,用单一IP通过“爬虫”技术非法访问一笔两划公司服务器数据多达 258 万次。
笔神作文称,学而思“爬虫”基本上把库里同个题目的所有作文全部抓取完了,这种行为不是正常人使用的方式。而且很多访问的间隔都是100毫秒左右,也不可能是正常人访问的速度。按业内的通常说法,这就是一种典型的“扒库”行为。
目前,学而思尚未对此作出回应。
学而思年内上线数学大模型
学而思是美股上市公司好未来旗下品牌。今年,AI大模型,好未来也在AI产品上,投入了大量精力。公司研发的产品就包括此次陷入争议的MathGPT和作文AI助手。
5月5日,好未来官方公众号发文表示,学而思正在进行数学大模型MathGPT的自研,该模型面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,目前已经取得阶段性成果,并将于年内推出基于该大模型的产品级应用。
学而思以数学培训起家。好未来表示,MathGPT是公司核心项目,由公司CTO(首席技术官)田密负责。
今年春节前,项目已启动相应的团队建设、数据、算力准备和技术研发,并且已启动在美国硅谷的团队建设,将成立一支海外算法和工程团队。
在该文章中,好未来还提到,学而思学习机近期也将会上线一款“AI助手”,涵盖作文助手、口语助手、阅读助手、数学助手等相关功能,该AI产品将于5月11日开启内测。
AI之外,去年以来好未来还探索了多个新的业务方向。今年以来,好未来相继发布了“学而思学习机”、“学而思大阅读”等产品。
在直播方面,学而思旗下直播平台“学家优品”上线一年来,虽然历经多次调整,但一直不温不火,截至目前其粉丝仅有21万。
近期,该直播间宣布停播并进行调整。按照学家优品主播的说法,10天后“学家优品2.0”将上线。