Midscene.js: 视觉模型驱动的全平台 UI 自动化 SDK
• 基于 pure-vision 路线进行 UI 定位与交互,仅依赖截图即可覆盖 Web、Android、iOS、桌面应用与 Canvas 场景
• 支持自然语言编排任务,可使用 Javascript SDK 或 YAML 编写脚本,并无缝集成 Puppeteer、Playwright、adb、WebDriverAgent
• 提供可视化报告、Playground 与 MCP 能力,便于调试回放、提升执行效率,并支持开源模型自托管
https://github.com/web-infra-dev/midscene
#自动化测试 #视觉语言模型 #跨平台 #UI #JavaScript #GitHub #MCP #Android #iOS
• 基于 pure-vision 路线进行 UI 定位与交互,仅依赖截图即可覆盖 Web、Android、iOS、桌面应用与 Canvas 场景
• 支持自然语言编排任务,可使用 Javascript SDK 或 YAML 编写脚本,并无缝集成 Puppeteer、Playwright、adb、WebDriverAgent
• 提供可视化报告、Playground 与 MCP 能力,便于调试回放、提升执行效率,并支持开源模型自托管
https://github.com/web-infra-dev/midscene
#自动化测试 #视觉语言模型 #跨平台 #UI #JavaScript #GitHub #MCP #Android #iOS