字节跳动开源多模态AI Agent—UI-TARS-1.5_

字节跳动开源多模态AI Agent—UI-TARS-1.5

4月23日，字节跳动开源了多模态AI Agent UI-TARS的最新1.5版本。与上一代相比，1.5版本在计算机使用、浏览器使用和手机使用等基准测试中均表现非常出色。

在计算机使用方面，OSworld测试得分为42.5，高于OpenAI CUA的36.4、Claude 3.7的28以及之前的最高水平38.1（200步）；Windows Agent Arena（50步）得分为42.1，远超之前的29.8。

浏览器使用方面，WebVoyager得分为84.8，接近OpenAI CUA和之前最高水平的87，Online-Mind2web得75.8，优于OpenAI CUA的71、Claude 3.7的62.9和之前的71。手机使用方面，Android World得64.2，高于之前的59.5。

打开APP阅读更多精彩内容