字节推出了功能类似于 Manus 一样的AI助手 UI-TARS-desktop ,已经在github开源下载 体验。
UI-TARS Desktop 是一个基于 UI-TARS(视觉语言模型)的图形用户界面(GUI)代理应用程序,允许用户通过自然语言控制计算机。以下是该软件的一些关键特点和功能:
主要特点
- 自然语言控制:利用视觉语言模型,用户可以通过自然语言指令与计算机进行交互。
- 截图和视觉识别支持:能够识别屏幕内容并进行相应操作。
- 精确的鼠标和键盘控制:提供高精度的输入控制,适合各种操作。
- 跨平台支持:兼容 Windows 和 MacOS 系统。
- 实时反馈:应用程序能够提供实时的操作反馈和状态显示。
- 隐私和安全:所有处理均在本地进行,确保用户数据的安全性。
更新与发布
- 技术预览版本:2025年3月18日发布了新桌面应用程序 Agent TARS,支持通过视觉解析网页进行浏览器操作,并与命令行和文件系统无缝集成。

TARS-desktop
https://github.com/bytedance/UI-TARS-desktop
UI-TARS Desktop
使用示例
- 获取天气:用户可以通过浏览器获取旧金山的当前天气。
- 发送推文:用户可以发送内容为“hello world”的推文。
许可证
UI-TARS Desktop 采用 Apache License 2.0 许可证,允许用户自由使用和修改。