AI那些事儿:就在刚刚,阿里悄悄开源了一个极度硬核,甚至有点断人财路的项目——PageAgent。 这玩意儿到底有多狠?简单来说,它干掉了职场里最反人类的重复劳动。 你回想一下你每天在公司的状态: 从表格复制数据,打开祖传的后台系统,填框,检查,点击提交。循环往复100遍。 这哪是在做业务?这明明就是个毫无感情的“人肉 API”。 但现在,有了 PageAgent,游戏规则变了。 以后...

阿里开源了名为 PageAgent 的网页自动化工具。它摒弃了传统 RPA 的截图方式,通过直接读取 HTML DOM 实现极速、稳定的浏览器内自动化,旨在彻底解放职场中的重复性“人肉 API”操作。

要点:
  • 阿里开源极度硬核的 PageAgent
  • 摒弃截图,直读 HTML DOM 结构
  • 浏览器原生运行,轻量且高效
  • 终结职场重复填表等繁琐劳动
  • 支持语音指令,重构 Web 交互方式

神器PageAgent:一行代码让网页听懂人话,自动帮用户填表点按钮

阿里开源的PageAgent通过一行JS代码实现网页自动化,利用AI听懂自然语言指令即可自动填表、点按钮。该项目无需配置Python或后端环境,支持本地模型部署,大幅降低了网页操作自动化的门槛。

要点:
  • 一行JS代码集成,无需后端环境
  • 支持自然语言指令自动操作网页
  • 支持Ollama本地模型,保障数据隐私
  • MIT协议开源,完全免费可商用
  • 适用于智能填表与产品教学场景