LaVague:利用 AI 轻松实现任何基于 Web 的任务自动化!( 网页 + Agent框架)
Aitrainee | 公众号:AI进修生
🌟用于开发 AI Web 代理的大型行动模型框架。
https://github.com/lavague-ai/LaVague
Hi,这里是Aitrainee,欢迎阅读本期新文章。
LaVague,这是一个用于开发AI网页应用的框架,它现在有了一些很酷的新更新,比如可以构建一个能够根据你的简历PNG自动申请工作的代理,这太疯狂了。
以前它只能做一些简单的任务,但现在似乎变得更好了,不仅能够处理常规任务,还能处理复杂任务。
看看这个展示视频,它展示了这一点。在下面展示视频中,开发者构建了一个代理,能够使用LaVague的开源框架根据简历的PNG文件申请工作,这使得代理能够在不到40秒内读取简历并填写表格。
这种方式你可以批量申请大量工作,简历会自动填写这些要求。
高频论文检索超越 Gemini 和 ChatGPT
使用 LaVague 创建一个代理,寻找 HuggingFace Papers 上最新最热门论文:
我们将创建代理并通过 Gradio 界面为其提供服务。
可以在下面的演示中看到LaVague的代理如何能够超越 Gemini 和 ChatGPT 来回答查询 :
"What is the most trendy recent paper on text-to-video on Hugging Face papers? Provide the date and a summary of the paper" 。
使用 LaVague 和 Pytest 实现 QA 自动化
LaVague 是一个很棒的工具,可以帮助你更有效地编写和维护自动化测试。手动编写测试脚本非常耗时。
LaVague 可以根据 Gherkin 编写的测试用例描述生成可重用的 pytest-bdd 代码。
除此以外,下面是 LaVague 如何采取多个步骤来实现“快速了解 PEFT”目标的示例:
代码更新了之后,你可以在Google Colab上访问并操作相关功能。
作为一个开源的大型动作模型框架,它被用于开发AI网页代理。
网页代理接收目标,比如打印Hugging Face Diffuser库的安装步骤,并能够执行所需的操作来实现这个目标。
LaVague利用两个核心组件,首先是世界模型,它接收目标和当前状态(即当前网页),并将其转化为指令。
其次是动作引擎,它将这些指令编译成动作代码,并利用Playwright和Selenium来执行这些代码。
安装与部署
那么如何开始呢?你只需用pip安装命令安装它,只需将其复制粘贴到命令提示符中。
之后你需要构建一个代理,并使用这里指定的目标实现它。
在他们的文档中有详细说明,他们进一步展示了如何自定义不同类型的内容,如何与不同的大型语言模型、不同类型的插件及其他第三方集成合作。
所以一定要看看快速指南及其自定义文档,这将为你提供更详细的安装过程和不同教程的展示。
https://docs.lavague.ai/
希望这篇文章对你有帮助,感谢阅读!
抓住前沿技术的机遇,与我们一起成为创新的超级个体
(把握AIGC时代的个人力量)
点这里👇关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~