Spaces:

clx123
/

owl

Sleeping

App Files Files Community

owl / README_zh.md

clx123

Upload folder using huggingface_hub

4402aa4 verified 9 months ago

preview code

raw

history blame contribute delete

12.7 kB

	<h1 align="center">
	🦉 OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation
	🦉 OWL: 优化劳动力学习的通用智能体，用于处理现实世界的自动化任务
	</h1>


	<div align="center">

	[![文档][docs-image]][docs-url]
	[![Discord][discord-image]][discord-url]
	[![X][x-image]][x-url]
	[![Reddit][reddit-image]][reddit-url]
	[![微信][wechat-image]][wechat-url]
	[![微信][owl-image]][owl-url]
	[![Hugging Face][huggingface-image]][huggingface-url]
	[![Star][star-image]][star-url]
	[![软件许可证][package-license-image]][package-license-url]


	</div>


	<hr>

	<div align="center">
	<h4 align="center">

	[English README](https://github.com/camel-ai/owl/tree/main) \|
	[社区](https://github.com/camel-ai/camel#community) \|
	[安装](#️-installation) \|
	[示例](https://github.com/camel-ai/owl/tree/main/owl) \|
	[论文](https://arxiv.org/abs/2303.17760) \|
	[引用](#-community) \|
	[贡献](https://github.com/camel-ai/owl/graphs/contributors) \|
	[CAMEL-AI](https://www.camel-ai.org/)

	</h4>

	<div align="center" style="background-color: #f0f7ff; padding: 10px; border-radius: 5px; margin: 15px 0;">
	<h3 style="color: #1e88e5; margin: 0;">
	🏆 OWL 在 GAIA 基准测试中取得 <span style="color: #d81b60; font-weight: bold; font-size: 1.2em;">58.18</span> 平均分，在开源框架中排名 <span style="color: #d81b60; font-weight: bold; font-size: 1.2em;">🏅️ #1</span>！ 🏆
	</h3>
	</div>

	<div align="center">

	🦉 OWL 是一个前沿的多智能体协作框架，推动任务自动化的边界，构建在 [CAMEL-AI Framework](https://github.com/camel-ai/camel)。

	我们的愿景是彻底变革 AI 智能体协作解决现实任务的方式。通过利用动态智能体交互，OWL 实现了跨多领域更自然、高效且稳健的任务自动化。

	</div>

	![](./assets/owl_architecture.png)



	<br>


	</div>

	<!-- # Key Features -->
	# 📋 目录

	- [📋 目录](#-目录)
	- [🔥 新闻](#-新闻)
	- [🎬 演示视频](#-演示视频)
	- [✨️ 核心功能](#-核心功能)
	- [🛠️ 安装](#️-安装)
	- [选项1：使用 uv（推荐）](#选项1使用-uv推荐)
	- [选项2：使用 venv 和 pip](#选项2使用-venv-和-pip)
	- [选项3：使用 conda](#选项3使用-conda)
	- [设置环境变量](#设置环境变量)
	- [使用Docker运行](#使用docker运行)
	- [🚀 快速开始](#-快速开始)
	- [🌐 网页界面](#-网页界面)
	- [🧪 实验](#-实验)
	- [⏱️ 未来计划](#️-未来计划)
	- [📄 许可证](#-许可证)
	- [🖊️ 引用](#️-引用)
	- [🔥 社区](#-社区)
	- [❓ 常见问题](#-常见问题)


	# 🔥 新闻

	- [2025.03.07]: 我们开源了 🦉 OWL 项目的代码库。

	# 🎬 演示视频

	https://private-user-images.githubusercontent.com/55657767/420211368-f29f477d-7eef-46da-8d7a-8f3bcf506da2.mp4

	https://private-user-images.githubusercontent.com/55657767/420212194-e813fc05-136a-485f-8df3-f10d9b4e63ec.mp4

	# ✨️ 核心功能

	- 在线搜索：使用维基百科、谷歌搜索等，进行实时信息检索
	- 多模态处理：支持互联网或本地视频、图片、语音处理
	- 浏览器操作：借助Playwright框架开发浏览器模拟交互，支持页面滚动、点击、输入、下载、历史回退等功能
	- 文件解析：word、excel、PDF、PowerPoint信息提取，内容转文本/Markdown
	- 代码执行：编写python代码，并使用解释器运行
	- 丰富工具包：提供丰富的工具包，包括ArxivToolkit（学术论文检索）、AudioAnalysisToolkit（音频分析）、CodeExecutionToolkit（代码执行）、DalleToolkit（图像生成）、DataCommonsToolkit（数据共享）、ExcelToolkit（Excel处理）、GitHubToolkit（GitHub交互）、GoogleMapsToolkit（地图服务）、GoogleScholarToolkit（学术搜索）、ImageAnalysisToolkit（图像分析）、MathToolkit（数学计算）、NetworkXToolkit（图形分析）、NotionToolkit（Notion交互）、OpenAPIToolkit（API操作）、RedditToolkit（Reddit交互）、SearchToolkit（搜索服务）、SemanticScholarToolkit（语义学术搜索）、SymPyToolkit（符号计算）、VideoAnalysisToolkit（视频分析）、WeatherToolkit（天气查询）、WebToolkit（网页交互）等多种专业工具，满足各类特定任务需求。

	# 🛠️ 安装

	## 选项1：使用 uv（推荐）

	```bash
	# 克隆 GitHub 仓库
	git clone https://github.com/camel-ai/owl.git

	# 进入项目目录
	cd owl

	# 如果你还没有安装 uv，请先安装
	pip install uv

	# 创建虚拟环境并安装依赖
	# 我们支持使用 Python 3.10、3.11、3.12
	uv venv .venv --python=3.10

	# 激活虚拟环境
	# 对于 macOS/Linux
	source .venv/bin/activate
	# 对于 Windows
	.venv\Scripts\activate

	# 安装 CAMEL 及其所有依赖
	uv pip install -e .

	# 完成后退出虚拟环境
	deactivate
	```

	## 选项2：使用 venv 和 pip

	```bash
	# 克隆 GitHub 仓库
	git clone https://github.com/camel-ai/owl.git

	# 进入项目目录
	cd owl

	# 创建虚拟环境
	# 对于 Python 3.10（也适用于 3.11、3.12）
	python3.10 -m venv .venv

	# 激活虚拟环境
	# 对于 macOS/Linux
	source .venv/bin/activate
	# 对于 Windows
	.venv\Scripts\activate

	# 从 requirements.txt 安装
	pip install -r requirements.txt
	```

	## 选项3：使用 conda

	```bash
	# 克隆 GitHub 仓库
	git clone https://github.com/camel-ai/owl.git

	# 进入项目目录
	cd owl

	# 创建 conda 环境
	conda create -n owl python=3.10

	# 激活 conda 环境
	conda activate owl

	# 选项1：作为包安装（推荐）
	pip install -e .

	# 选项2：从 requirements.txt 安装
	pip install -r requirements.txt

	# 完成后退出 conda 环境
	conda deactivate
	```

	## 设置环境变量

	在 `owl/.env_template` 文件中，你可以找到所有必要的 API 密钥以及各服务的注册网址。要使用这些 API 服务，请按照以下步骤操作：

	1. 复制并重命名: 复制 `.env_template` 文件，并将副本重命名为 `.env`。
	2. 填写你的密钥: 打开 `.env` 文件，在相应字段中填入你的 API 密钥。
	3. 如需使用更多其他模型：请参考我们CAMEL的models文档：https://docs.camel-ai.org/key_modules/models.html#supported-model-platforms-in-camel

	> 注意：为获得最佳性能，我们强烈建议使用 OpenAI 模型。我们通过测试发现，其他模型在处理复杂任务和基准测试时可能会导致性能显著降低。

	## 使用Docker运行

	如果您希望使用Docker运行OWL项目，我们提供了完整的Docker支持：

	```bash
	# 克隆仓库
	git clone https://github.com/camel-ai/owl.git
	cd owl

	# 配置环境变量
	cp owl/.env_template owl/.env
	# 编辑.env文件，填入您的API密钥

	# 选项1：直接使用docker-compose
	cd .container
	docker-compose up -d
	# 在容器中运行OWL
	docker-compose exec owl bash -c "xvfb-python run.py"

	# 选项2：使用提供的脚本构建和运行
	cd .container
	chmod +x build_docker.sh
	./build_docker.sh
	# 在容器中运行OWL
	./run_in_docker.sh "您的问题"
	```

	更多详细的Docker使用说明，包括跨平台支持、优化配置和故障排除，请参阅 [DOCKER_README.md](.container/DOCKER_README.md)

	# 🚀 快速开始

	运行以下示例：

	```bash
	python owl/run.py
	```

	我们还提供了一个最小化示例，只需配置LLM的API密钥即可运行：

	```bash
	python owl/run_mini.py
	```

	## 使用不同的模型

	OWL 支持多种 LLM 后端。您可以使用以下脚本来运行不同的模型：

	```bash
	# 使用 Qwen 模型运行
	python owl/run_qwen.py

	# 使用 Deepseek 模型运行
	python owl/run_deepseek.py

	# 使用其他 OpenAI 兼容模型运行
	python owl/run_openai_compatiable_model.py
	```

	你可以通过修改 `run.py` 脚本来运行自己的任务：

	```python
	# Define your own task
	question = "Task description here."

	society = construct_society(question)
	answer, chat_history, token_count = run_society(society)

	print(f"\033[94mAnswer: {answer}\033[0m")
	```

	上传文件时，只需提供文件路径和问题：

	```python
	# 处理本地文件（例如，文件路径为 `tmp/example.docx`）
	question = "给定的 DOCX 文件中有什么内容？文件路径如下：tmp/example.docx"

	society = construct_society(question)
	answer, chat_history, token_count = run_society(society)

	print(f"答案：{answer}")
	```

	OWL 将自动调用与文档相关的工具来处理文件并提取答案。

	你可以尝试以下示例任务：
	- "查询苹果公司的最新股票价格"
	- "分析关于气候变化的最新推文情绪"
	- "帮我调试这段 Python 代码：[在此粘贴你的代码]"
	- "总结这篇研究论文的主要观点：[论文URL]"

	# 🌐 网页界面

	OWL 现在包含一个基于网页的用户界面，使与系统交互变得更加容易。要启动网页界面，请运行：

	```bash
	python run_app.py
	```

	网页界面提供以下功能：

	- 便捷的模型选择：选择不同的模型（OpenAI、Qwen、DeepSeek等）
	- 环境变量管理：直接从界面配置API密钥和其他设置
	- 交互式聊天界面：通过用户友好的界面与OWL智能体交流
	- 任务历史：查看交互的历史记录和结果

	网页界面使用Gradio构建，在您的本地机器上运行。除了您配置的模型API调用所需的数据外，不会向外部服务器发送任何数据。

	# 🧪 实验

	我们提供了一个脚本用于复现 GAIA 上的实验结果。
	要复现我们在 GAIA 基准测试中获得的 58.18 分：

	1. 切换到 `gaia58.18` 分支：
	```bash
	git checkout gaia58.18
	```

	2. 运行评估脚本：
	```bash
	python run_gaia_roleplaying.py
	```

	# ⏱️ 未来计划

	- [ ] 撰写一篇技术博客，详细介绍我们在现实任务中多智能体协作方面的探索与见解。
	- [ ] 通过引入更多针对特定领域任务的专业工具，进一步完善工具生态系统。
	- [ ] 开发更复杂的智能体交互模式和通信协议


	# 📄 许可证

	源代码采用 Apache 2.0 许可证。

	# 🖊️ 引用

	如果你觉得这个仓库对你有帮助，请引用：


	```
	@misc{owl2025,
	title = {OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation},
	author = {{CAMEL-AI.org}},
	howpublished = {\url{https://github.com/camel-ai/owl}},
	note = {Accessed: 2025-03-07},
	year = {2025}
	}
	```

	# 🔥 社区
	加入我们，参与更多讨论！
	<!-- ![](./assets/community.png) -->
	![](./assets/community_6.png)
	<!-- ![](./assets/meetup.jpg) -->

	# ❓ 常见问题

	Q: 为什么启动示例脚本后，我没有看到本地运行Chrome浏览器？

	A: 当OWL判断某个任务可以使用非浏览器工具（如搜索、代码分析等）完成时，浏览器就不会启动。只有在判断需要使用浏览器工具的时候，本地才会弹出浏览器窗口，并进行浏览器模拟交互。

	[docs-image]: https://img.shields.io/badge/Documentation-EB3ECC
	[docs-url]: https://camel-ai.github.io/camel/index.html
	[star-image]: https://img.shields.io/github/stars/camel-ai/owl?label=stars&logo=github&color=brightgreen
	[star-url]: https://github.com/camel-ai/owl/stargazers
	[package-license-image]: https://img.shields.io/badge/License-Apache_2.0-blue.svg
	[package-license-url]: https://github.com/camel-ai/owl/blob/main/licenses/LICENSE

	[colab-url]: https://colab.research.google.com/drive/1AzP33O8rnMW__7ocWJhVBXjKziJXPtim?usp=sharing
	[colab-image]: https://colab.research.google.com/assets/colab-badge.svg
	[huggingface-url]: https://huggingface.co/camel-ai
	[huggingface-image]: https://img.shields.io/badge/%F0%9F%A4%97%20Hugging%20Face-CAMEL--AI-ffc107?color=ffc107&logoColor=white
	[discord-url]: https://discord.camel-ai.org/
	[discord-image]: https://img.shields.io/discord/1082486657678311454?logo=discord&labelColor=%20%235462eb&logoColor=%20%23f5f5f5&color=%20%235462eb
	[wechat-url]: https://ghli.org/camel/wechat.png
	[wechat-image]: https://img.shields.io/badge/WeChat-CamelAIOrg-brightgreen?logo=wechat&logoColor=white
	[x-url]: https://x.com/CamelAIOrg
	[x-image]: https://img.shields.io/twitter/follow/CamelAIOrg?style=social
	[twitter-image]: https://img.shields.io/twitter/follow/CamelAIOrg?style=social&color=brightgreen&logo=twitter
	[reddit-url]: https://www.reddit.com/r/CamelAI/
	[reddit-image]: https://img.shields.io/reddit/subreddit-subscribers/CamelAI?style=plastic&logo=reddit&label=r%2FCAMEL&labelColor=white
	[ambassador-url]: https://www.camel-ai.org/community
	[owl-url]: ./assets/qr_code.jpg
	[owl-image]: https://img.shields.io/badge/WeChat-OWLProject-brightgreen?logo=wechat&logoColor=white