Spaces:
Sleeping
Sleeping
feat: Multifaceted context and UI redesign
Browse files
GEMINI.md
CHANGED
|
@@ -155,4 +155,28 @@
|
|
| 155 |
c. 如果不包含,则使用 `run_shell_command` 执行 `sleep 10` 等待10秒。
|
| 156 |
d. 等待后,**必须重新执行 `take_snapshot`**,因为页面DOM可能会在状态更新后改变,导致旧的 `uid` 失效。
|
| 157 |
e. 重复以上步骤,直到状态变为 "Running"。
|
| 158 |
-
5. **确认完成**: 检测到 "Running" 状态后,确认部署成功。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 155 |
c. 如果不包含,则使用 `run_shell_command` 执行 `sleep 10` 等待10秒。
|
| 156 |
d. 等待后,**必须重新执行 `take_snapshot`**,因为页面DOM可能会在状态更新后改变,导致旧的 `uid` 失效。
|
| 157 |
e. 重复以上步骤,直到状态变为 "Running"。
|
| 158 |
+
5. **确认完成**: 检测到 "Running" 状态后,确认部署成功。
|
| 159 |
+
|
| 160 |
+
### 2. 验证应用端到端(E2E)功能
|
| 161 |
+
|
| 162 |
+
这是一个用于在应用部署后,自动化测试其核心功能的标准流程。
|
| 163 |
+
|
| 164 |
+
1. **打开应用界面**:
|
| 165 |
+
* 使用 `browser_navigate` 或 `new_page` 工具访问应用页面的直接 URL (例如 `https://[space-name].hf.space`)。
|
| 166 |
+
* **注意**: 如果应用被包裹在 `Iframe` 中,需要先用 `evaluate_script` 获取 `Iframe` 的 `src` 属性,然后直接导航到该 `src` URL。
|
| 167 |
+
|
| 168 |
+
2. **定位交互元素**:
|
| 169 |
+
* 使用 `take_snapshot` 获取页面快照。
|
| 170 |
+
* 从快照中分析并记录下关键交互元素(如输入框、发送按钮)的 `uid`。
|
| 171 |
+
|
| 172 |
+
3. **交互并发送信息**:
|
| 173 |
+
* 使用 `fill` 工具,根据 `uid` 将文本(如“你好”)填入输入框。
|
| 174 |
+
* **关键步骤**: 交互(如 `fill`)可能会导致页面 DOM 更新。因此,必须重新执行 `take_snapshot` 来获取最新的快照。
|
| 175 |
+
* 使用 `click` 工具,并传入**新快照**中获得的“发送”按钮的 `uid`,以发送消息。
|
| 176 |
+
|
| 177 |
+
4. **等待并验证结果**:
|
| 178 |
+
* 使用 `run_shell_command` 执行 `sleep 10` 或更长时间,以等待后端模型处理和响应。
|
| 179 |
+
* 再次执行 `take_snapshot` 获取最终的页面状态。
|
| 180 |
+
* **检查聊天记录**: 分析快照,确认聊天窗口中是否包含了用户的输入和模型的回复。
|
| 181 |
+
* **检查任务信息**: 检查“Task Intent”和“Extracted Steps”文本框中的内容,确认工作流提取是否成功。
|
| 182 |
+
* **识别错误**: 检查关键组件附近是否存在 "Error" 标签或文本,以判断流程中是否有可见的错误发生。
|