cafe3310 commited on
Commit
feb5d28
·
1 Parent(s): 12932a7

feat: Multifaceted context and UI redesign

Browse files
Files changed (1) hide show
  1. GEMINI.md +25 -1
GEMINI.md CHANGED
@@ -155,4 +155,28 @@
155
  c. 如果不包含,则使用 `run_shell_command` 执行 `sleep 10` 等待10秒。
156
  d. 等待后,**必须重新执行 `take_snapshot`**,因为页面DOM可能会在状态更新后改变,导致旧的 `uid` 失效。
157
  e. 重复以上步骤,直到状态变为 "Running"。
158
- 5. **确认完成**: 检测到 "Running" 状态后,确认部署成功。
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
155
  c. 如果不包含,则使用 `run_shell_command` 执行 `sleep 10` 等待10秒。
156
  d. 等待后,**必须重新执行 `take_snapshot`**,因为页面DOM可能会在状态更新后改变,导致旧的 `uid` 失效。
157
  e. 重复以上步骤,直到状态变为 "Running"。
158
+ 5. **确认完成**: 检测到 "Running" 状态后,确认部署成功。
159
+
160
+ ### 2. 验证应用端到端(E2E)功能
161
+
162
+ 这是一个用于在应用部署后,自动化测试其核心功能的标准流程。
163
+
164
+ 1. **打开应用界面**:
165
+ * 使用 `browser_navigate` 或 `new_page` 工具访问应用页面的直接 URL (例如 `https://[space-name].hf.space`)。
166
+ * **注意**: 如果应用被包裹在 `Iframe` 中,需要先用 `evaluate_script` 获取 `Iframe` 的 `src` 属性,然后直接导航到该 `src` URL。
167
+
168
+ 2. **定位交互元素**:
169
+ * 使用 `take_snapshot` 获取页面快照。
170
+ * 从快照中分析并记录下关键交互元素(如输入框、发送按钮)的 `uid`。
171
+
172
+ 3. **交互并发送信息**:
173
+ * 使用 `fill` 工具,根据 `uid` 将文本(如“你好”)填入输入框。
174
+ * **关键步骤**: 交互(如 `fill`)可能会导致页面 DOM 更新。因此,必须重新执行 `take_snapshot` 来获取最新的快照。
175
+ * 使用 `click` 工具,并传入**新快照**中获得的“发送”按钮的 `uid`,以发送消息。
176
+
177
+ 4. **等待并验证结果**:
178
+ * 使用 `run_shell_command` 执行 `sleep 10` 或更长时间,以等待后端模型处理和响应。
179
+ * 再次执行 `take_snapshot` 获取最终的页面状态。
180
+ * **检查聊天记录**: 分析快照,确认聊天窗口中是否包含了用户的输入和模型的回复。
181
+ * **检查任务信息**: 检查“Task Intent”和“Extracted Steps”文本框中的内容,确认工作流提取是否成功。
182
+ * **识别错误**: 检查关键组件附近是否存在 "Error" 标签或文本,以判断流程中是否有可见的错误发生。