Spaces:

angelsg213
/

TESTING22

Sleeping

App Files Files Community

angelsg213 commited on 7 days ago

Commit

95b72cc

verified ·

1 Parent(s): 6e58e9b

Update app.py

Browse files

Files changed (1) hide show

app.py +207 -399

app.py CHANGED Viewed

@@ -12,37 +12,7 @@ from reportlab.lib.units import inch
 from reportlab.platypus import SimpleDocTemplate, Table, TableStyle, Paragraph, Spacer
 from reportlab.lib.styles import getSampleStyleSheet, ParagraphStyle
 from reportlab.lib.enums import TA_CENTER, TA_RIGHT, TA_LEFT
-from pdf2image import convert_from_path
-import base64
-from io import BytesIO
-from PIL import Image as PILImage
-# ============= CONVERTIR PDF A IMÁGENES =============
-def pdf_to_images(pdf_path):
-    """Convierte cada página del PDF en una imagen"""
-    try:
-        from pdf2image import convert_from_path
-        images = convert_from_path(pdf_path, dpi=200)
-        return images
-    except ImportError:
-        print("⚠️ pdf2image no está instalado o poppler no está disponible")
-        return []
-    except Exception as e:
-        print(f"Error convirtiendo PDF a imágenes: {str(e)}")
-        # Intentar con método alternativo usando PIL
-        try:
-            from PIL import Image
-            import fitz  # PyMuPDF como alternativa
-            doc = fitz.open(pdf_path)
-            images = []
-            for page in doc:
-                pix = page.get_pixmap(dpi=200)
-                img = Image.frombytes("RGB", [pix.width, pix.height], pix.samples)
-                images.append(img)
-            doc.close()
-            return images
-        except:
-            return []
 # ============= EXTRAER TEXTO DEL PDF =============
 def extraer_texto_pdf(pdf_file):
@@ -55,261 +25,106 @@ def extraer_texto_pdf(pdf_file):
     except Exception as e:
         return f"Error: {str(e)}"
-# ============= VQA - VISUAL QUESTION ANSWERING =============
-def analizar_con_vqa(pdf_path, pregunta_usuario="¿Qué información contiene esta factura?"):
-    """Usa modelos de Visual Question Answering de Hugging Face"""
     token = os.getenv("aa")
     if not token:
-        return "❌ Error: Falta configurar HF_TOKEN en Settings → Secrets"
-    # Convertir primera página a imagen
-    images = pdf_to_images(pdf_path)
-    if not images:
-        return "❌ No se pudo convertir el PDF a imagen. Instala poppler-utils o PyMuPDF (fitz) para habilitar esta funcionalidad.\n\n💡 Mientras tanto, usa las otras pestañas como 'Document QA' que funcionan con el texto extraído."
-    primera_pagina = images[0]
-    # Modelos VQA de Hugging Face (verificados y funcionales)
-    modelos_vqa = [
-        "dandelin/vilt-b32-finetuned-vqa",
-        "Salesforce/blip-vqa-base",
-        "Salesforce/blip2-opt-2.7b"
-    ]
-    client = InferenceClient(token=token)
-    resultados = []
-    for modelo in modelos_vqa:
-        try:
-            print(f"\n🔍 Probando VQA con: {modelo}")
-            # Usar API de Hugging Face para VQA
-            result = client.visual_question_answering(
-                image=primera_pagina,
-                question=pregunta_usuario,
-                model=modelo
-            )
-            respuesta = result[0]['answer'] if isinstance(result, list) else str(result)
-            resultados.append(f"**🤖 {modelo}**\n📝 Respuesta: {respuesta}\n")
-            print(f"✅ Éxito con {modelo}")
-        except Exception as e:
-            print(f"❌ Error con {modelo}: {str(e)}")
-            resultados.append(f"**{modelo}**: Error - {str(e)[:100]}\n")
-    if resultados:
-        return "\n".join(resultados)
-    return "❌ No se pudo procesar con modelos VQA"
-# ============= DOCUMENT QA - QUESTION ANSWERING SOBRE TEXTO =============
-def analizar_con_document_qa(texto, pregunta_usuario="¿Cuál es el total de la factura?"):
-    """Usa modelos de Question Answering de Hugging Face sobre documentos"""
-    token = os.getenv("aa")
-    if not token:
-        return "❌ Error: Falta configurar HF_TOKEN"
-    texto_limpio = texto[:3000]  # Limitar contexto para los modelos
-    # Modelos de Question Answering de Hugging Face
-    modelos_qa = [
-        "deepset/roberta-base-squad2",
-        "distilbert-base-cased-distilled-squad",
-        "deepset/bert-base-cased-squad2"
-    ]
-    client = InferenceClient(token=token)
-    resultados = []
-    for modelo in modelos_qa:
-        try:
-            print(f"\n📄 Probando Document QA con: {modelo}")
-            response = client.question_answering(
-                question=pregunta_usuario,
-                context=texto_limpio,
-                model=modelo
-            )
-            respuesta = response['answer']
-            confianza = response['score']
-            resultados.append(
-                f"**🤖 {modelo}**\n"
-                f"📝 Respuesta: **{respuesta}**\n"
-                f"📊 Confianza: {confianza:.2%}\n"
-            )
-            print(f"✅ Éxito con {modelo}")
-        except Exception as e:
-            print(f"❌ Error con {modelo}: {str(e)}")
-            resultados.append(f"**{modelo}**: Error\n")
-    if resultados:
-        return "\n".join(resultados)
-    return "❌ No se pudo procesar con modelos Document QA"
-# ============= LAYOUT DOCUMENT QA =============
-def analizar_con_layout_qa(pdf_path, texto, pregunta_usuario="¿Cuál es el número de factura?"):
-    """Usa modelos LayoutLM para entender documentos con layout visual"""
-    token = os.getenv("aa")
-    if not token:
-        return "❌ Error: Falta configurar HF_TOKEN"
-    # Modelos especializados en Document Understanding con layout
-    modelos_layout = [
-        "impira/layoutlm-document-qa",
-        "microsoft/layoutlmv2-base-uncased",
-        "nielsr/layoutlmv3-finetuned-funsd"
-    ]
-    client = InferenceClient(token=token)
-    texto_limpio = texto[:2500]
-    resultados = []
-    for modelo in modelos_layout:
-        try:
-            print(f"\n📐 Probando Layout Document QA con: {modelo}")
-            # Usar question answering sobre el texto extraído
-            response = client.question_answering(
-                question=pregunta_usuario,
-                context=texto_limpio,
-                model=modelo
-            )
-            respuesta = response['answer']
-            confianza = response['score']
-            resultados.append(
-                f"**🤖 {modelo}**\n"
-                f"📝 Respuesta: **{respuesta}**\n"
-                f"📊 Confianza: {confianza:.2%}\n"
-            )
-            print(f"✅ Éxito con {modelo}")
-        except Exception as e:
-            print(f"❌ Error con {modelo}: {str(e)}")
-            resultados.append(f"**{modelo}**: No disponible\n")
-    if resultados:
-        return "\n".join(resultados)
-    return "❌ No se pudo procesar con modelos Layout QA"
-# ============= VISUAL DOCUMENT UNDERSTANDING CON MODELOS DE HF =============
-def analizar_documento_visual_hf(pdf_path):
-    """Usa modelos multimodales de Hugging Face para entender documentos visualmente"""
-    token = os.getenv("aa")
-    if not token:
-        return None, "❌ Error: Falta configurar HF_TOKEN"
-    images = pdf_to_images(pdf_path)
-    if not images:
-        return None, "❌ No se pudo convertir el PDF"
-    primera_pagina = images[0]
-    # Modelos multimodales de Hugging Face para Document Understanding
-    modelos_visuales = [
-        "microsoft/trocr-large-printed",
-        "Salesforce/blip-image-captioning-large",
-        "nlpconnect/vit-gpt2-image-captioning"
     ]
-    client = InferenceClient(token=token)
-    resultados = []
-    for modelo in modelos_visuales:
         try:
-            print(f"\n🖼️ Probando Visual Document con: {modelo}")
-            # Usar image-to-text para OCR y comprensión visual
-            response = client.image_to_text(
-                image=primera_pagina,
-                model=modelo
             )
-            texto_extraido = response if isinstance(response, str) else response.get('generated_text', str(response))
-            resultados.append(f"**🤖 {modelo}**\n📝 Texto extraído:\n{texto_extraido}\n")
-            print(f"✅ Éxito con {modelo}")
         except Exception as e:
             print(f"❌ Error con {modelo}: {str(e)}")
-            resultados.append(f"**{modelo}**: Error\n")
-    if resultados:
-        return "\n".join(resultados), "✅ Procesado con modelos visuales"
-    return None, "❌ No se pudo procesar visualmente"
-# ============= DOCUMENT RETRIEVAL - BÚSQUEDA EN DOCUMENTOS =============
-def buscar_en_documento(texto, consulta="información sobre el emisor"):
-    """Usa modelos de embeddings para búsqueda semántica en documentos"""
-    token = os.getenv("aa")
-    if not token:
-        return "❌ Error: Falta configurar HF_TOKEN"
-    # Modelos de embeddings para búsqueda semántica
-    modelos_retrieval = [
-        "sentence-transformers/all-MiniLM-L6-v2",
-        "sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2"
     ]
-    client = InferenceClient(token=token)
-    # Dividir el texto en fragmentos
-    fragmentos = [texto[i:i+500] for i in range(0, min(len(texto), 3000), 500)]
-    resultados = []
-    for modelo in modelos_retrieval:
         try:
-            print(f"\n🔎 Probando Document Retrieval con: {modelo}")
-            # Generar embedding de la consulta
-            query_embedding = client.feature_extraction(
-                text=consulta,
                 model=modelo
             )
-            # Buscar fragmentos más relevantes
-            scores = []
-            for i, frag in enumerate(fragmentos):
-                try:
-                    frag_embedding = client.feature_extraction(
-                        text=frag,
-                        model=modelo
-                    )
-                    # Calcular similitud (simplificado)
-                    scores.append((i, frag))
-                except:
-                    continue
-            if scores:
-                # Tomar los 2 fragmentos más relevantes
-                top_frags = scores[:2]
-                resultado_texto = "\n\n".join([f"**Fragmento {i+1}:**\n{frag[:300]}..." for i, frag in top_frags])
-                resultados.append(
-                    f"**🤖 {modelo}**\n"
-                    f"📍 Fragmentos relevantes encontrados:\n{resultado_texto}\n"
-                )
-                print(f"✅ Éxito con {modelo}")
         except Exception as e:
-            print(f"❌ Error con {modelo}: {str(e)}")
-            resultados.append(f"**{modelo}**: Error\n")
-    if resultados:
-        return "\n".join(resultados)
-    return "❌ No se pudo realizar búsqueda en el documento"
 # ============= ANALIZAR CON LLM Y CONVERTIR A JSON =============
 def analizar_y_convertir_json(texto):
@@ -639,6 +454,35 @@ with gr.Blocks(title="Extractor de Facturas con IA Avanzada") as demo:
                     gr.Markdown("### Subir Factura PDF")
                     pdf_input = gr.File(label="Seleccionar factura PDF", file_types=[".pdf"], type="filepath")
                     btn_extraer = gr.Button("🚀 Extraer Datos de la Factura", variant="primary", size="lg")
                     gr.Markdown("---")
                     csv_output = gr.File(label="📥 Descargar CSV generado")
                     gr.Markdown("---")
@@ -660,145 +504,135 @@ with gr.Blocks(title="Extractor de Facturas con IA Avanzada") as demo:
                         with gr.Tab("Más información"):
                             resumen_tecnico = gr.Markdown(label="Estructura de datos y metadatos")
-        # ============= TAB 2: CONSULTAS INTELIGENTES (TODO EN UNO) =============
-        with gr.Tab("🤖 Consultas con IA"):
             gr.Markdown("""
-            ### 💬 Pregunta lo que necesites sobre tu factura
-            Los modelos de IA responden preguntas específicas sobre el contenido de la factura.
             """)
             with gr.Row():
                 with gr.Column(scale=1):
                     pregunta_ia = gr.Textbox(
-                        label="Tu pregunta sobre la factura",
-                        placeholder="Ejemplos: ¿Cuál es el total? ¿Quién es el emisor? ¿Cuál es el NIF?",
-                        value="¿Cuál es el total de la factura?",
-                        lines=3
                     )
-                    gr.Markdown("#### Ejemplos de preguntas:")
                     gr.Markdown("""
                     - ¿Cuál es el total de la factura?
                     - ¿Cuál es el número de factura?
-                    - ¿Quién es el emisor?
-                    - ¿Cuál es el NIF del emisor?
-                    - ¿Cuántos productos hay?
-                    - ¿Cuál es la fecha de emisión?
-                    """)
-                    btn_consulta_ia = gr.Button("🔍 Consultar", variant="primary", size="lg")
-                with gr.Column(scale=2):
-                    gr.Markdown("### 📝 Respuestas de los modelos")
-                    resultado_consulta = gr.Markdown(label="Respuestas")
-            gr.Markdown("---")
-            gr.Markdown("""
-            **Modelos utilizados:**
-            - `deepset/roberta-base-squad2` - RoBERTa especializado en QA
-            - `deepset/bert-base-cased-squad2` - BERT optimizado para preguntas
-            - `distilbert-base-cased-distilled-squad` - DistilBERT eficiente
-            Estos modelos están entrenados para extraer respuestas precisas del texto.
-            """)
-        # ============= TAB 3: BÚSQUEDA SEMÁNTICA =============
-        with gr.Tab("🔎 Búsqueda Inteligente"):
-            gr.Markdown("""
-            ### 🎯 Encuentra información relevante en tu factura
-            Búsqueda semántica que entiende el significado de tu consulta.
-            """)
-            with gr.Row():
-                with gr.Column(scale=1):
-                    consulta_busqueda = gr.Textbox(
-                        label="¿Qué información buscas?",
-                        placeholder="Ejemplos: información del emisor, detalles de productos, información de pago",
-                        value="información sobre el emisor",
-                        lines=3
-                    )
-                    gr.Markdown("#### Ejemplos de búsquedas:")
-                    gr.Markdown("""
-                    - Información sobre el emisor
-                    - Detalles de productos o servicios
-                    - Información de pago
-                    - Datos del cliente
-                    - Fechas importantes
                     """)
-                    btn_busqueda = gr.Button("🔎 Buscar", variant="primary", size="lg")
                 with gr.Column(scale=2):
-                    gr.Markdown("### 📋 Fragmentos relevantes encontrados")
-                    resultado_busqueda = gr.Markdown(label="Resultados")
-            gr.Markdown("---")
-            gr.Markdown("""
-            **Modelos de embeddings utilizados:**
-            - `sentence-transformers/all-MiniLM-L6-v2` - Embeddings rápidos y precisos
-            - `sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2` - Soporte multilingüe
-            La búsqueda semántica encuentra información relevante aunque uses palabras diferentes.
-            """)
-        # ============= TAB 4: ANÁLISIS VISUAL (OPCIONAL) =============
-        with gr.Tab("🖼️ Análisis Visual (Beta)"):
-            gr.Markdown("""
-            ### 📸 Análisis visual del documento
-            **Nota:** Esta funcionalidad requiere dependencias adicionales (poppler-utils o PyMuPDF).
-            """)
-            with gr.Row():
-                with gr.Column(scale=1):
-                    pregunta_visual = gr.Textbox(
-                        label="Pregunta sobre la imagen",
-                        placeholder="¿Qué información contiene la factura?",
-                        value="¿Qué información importante contiene esta factura?",
-                        lines=3
                     )
-                    btn_visual = gr.Button("🖼️ Analizar Visualmente", variant="primary", size="lg")
                     gr.Markdown("---")
-                    gr.Markdown("""
-                    ⚠️ **Requisitos:**
-                    - Poppler-utils instalado en el sistema
-                    - O PyMuPDF (fitz) como alternativa
-                    Si no funciona, usa las otras pestañas que trabajan con el texto.
                     """)
-                with gr.Column(scale=2):
-                    resultado_visual = gr.Markdown(label="Análisis visual")
-            gr.Markdown("""
-            **Modelos de visión utilizados:**
-            - `dandelin/vilt-b32-finetuned-vqa` - Vision-and-Language Transformer
-            - `Salesforce/blip-vqa-base` - BLIP para Visual QA
-            - `microsoft/trocr-large-printed` - OCR avanzado
-            """)
     gr.Markdown("---")
     gr.Markdown("""
-    ### 📚 Guía rápida
-    1. **Extracción Automática:** Sube tu PDF y extrae todos los datos automáticamente
-    2. **Consultas con IA:** Haz preguntas específicas sobre la factura
-    3. **Búsqueda Inteligente:** Encuentra información relevante por tema
-    4. **Análisis Visual:** (Opcional) Analiza la imagen del documento
-    💡 **Tip:** Empieza por la pestaña "Extracción Automática" para procesar tu factura.
     """)
     # ============= CONECTAR EVENTOS =============
-    # Extracción automática
     btn_extraer.click(
-        fn=procesar_factura,
         inputs=[pdf_input],
         outputs=[texto_extraido, tabla_preview, csv_output, resumen_tecnico, info_util,
-                datos_json_state, csv_file_state, pdf_path_state]
     )
     # Generar PDF
@@ -808,50 +642,24 @@ with gr.Blocks(title="Extractor de Facturas con IA Avanzada") as demo:
         outputs=[pdf_output, pdf_status]
     )
-    # Consultas con IA (unificado Document QA)
-    def ejecutar_consulta_ia(texto, pregunta):
         if not texto:
-            return "❌ Por favor, procesa una factura primero en la pestaña 'Extracción Automática'"
-        return analizar_con_document_qa(texto, pregunta)
-    btn_consulta_ia.click(
-        fn=ejecutar_consulta_ia,
-        inputs=[texto_extraido, pregunta_ia],
-        outputs=[resultado_consulta]
-    )
-    # Búsqueda semántica
-    def ejecutar_busqueda_semantica(texto, consulta):
-        if not texto:
-            return "❌ Por favor, procesa una factura primero en la pestaña 'Extracción Automática'"
-        return buscar_en_documento(texto, consulta)
-    btn_busqueda.click(
-        fn=ejecutar_busqueda_semantica,
-        inputs=[texto_extraido, consulta_busqueda],
-        outputs=[resultado_busqueda]
-    )
-    # Análisis visual (combinado VQA + Visual Document Understanding)
-    def ejecutar_analisis_visual(pdf_path, pregunta):
-        if not pdf_path:
-            return "❌ Por favor, procesa una factura primero en la pestaña 'Extracción Automática'"
-        # Intentar VQA primero
-        resultado_vqa = analizar_con_vqa(pdf_path, pregunta)
-        # Si VQA no funciona, intentar Visual Document Understanding
-        if "No se pudo convertir" in resultado_vqa or "Error" in resultado_vqa:
-            resultado_visual, status = analizar_documento_visual_hf(pdf_path)
-            if resultado_visual:
-                return f"{resultado_vqa}\n\n---\n\n### Análisis Visual Alternativo:\n\n{resultado_visual}"
-        return resultado_vqa
-    btn_visual.click(
-        fn=ejecutar_analisis_visual,
-        inputs=[pdf_path_state, pregunta_visual],
-        outputs=[resultado_visual]
     )
 if __name__ == "__main__":

 from reportlab.platypus import SimpleDocTemplate, Table, TableStyle, Paragraph, Spacer
 from reportlab.lib.styles import getSampleStyleSheet, ParagraphStyle
 from reportlab.lib.enums import TA_CENTER, TA_RIGHT, TA_LEFT
+import time
 # ============= EXTRAER TEXTO DEL PDF =============
 def extraer_texto_pdf(pdf_file):
     except Exception as e:
         return f"Error: {str(e)}"
+# ============= ASISTENTE IA CONVERSACIONAL =============
+def asistente_ia_factura(texto, pregunta_usuario):
+    """Asistente IA que explica conceptos, responde preguntas y da consejos sobre facturas"""
     token = os.getenv("aa")
     if not token:
+        return "❌ Error: Falta configurar HF_TOKEN en Settings → Secrets", None
+    texto_limpio = texto[:6000]
+    prompt = f"""Eres un asistente experto en facturas y finanzas que ayuda a entender documentos comerciales.
+TEXTO DE LA FACTURA:
+{texto_limpio}
+PREGUNTA DEL USUARIO: {pregunta_usuario}
+INSTRUCCIONES:
+1. Responde de forma clara, amigable y profesional en español
+2. Si te preguntan sobre conceptos (IVA, base imponible, etc.), explícalos de manera sencilla
+3. Si te preguntan datos específicos, extráelos del texto de la factura
+4. Da consejos útiles cuando sea relevante (gestión, pagos, fiscalidad básica)
+5. Si no encuentras información específica en la factura, indícalo claramente
+6. Usa un lenguaje accesible para personas sin conocimientos técnicos
+7. Sé conciso pero completo (máximo 250 palabras)
+Responde ahora:"""
+    modelos = [
+        "Qwen/Qwen2.5-72B-Instruct",
+        "meta-llama/Llama-3.2-3B-Instruct",
+        "mistralai/Mistral-Nemo-Instruct-2407"
     ]
+    for modelo in modelos:
         try:
+            print(f"\n🤖 Consultando con: {modelo}")
+            client = InferenceClient(token=token)
+            response = client.chat.completions.create(
+                model=modelo,
+                messages=[
+                    {"role": "system", "content": "Eres un asistente experto en facturas, finanzas y contabilidad básica. Ayudas a las personas a entender sus documentos comerciales."},
+                    {"role": "user", "content": prompt}
+                ],
+                max_tokens=800,
+                temperature=0.7
             )
+            respuesta = response.choices[0].message.content
+            print(f"✅ Respuesta obtenida con {modelo}")
+            # Generar audio de la respuesta
+            audio_path = generar_audio_respuesta(respuesta, client)
+            return respuesta, audio_path
         except Exception as e:
             print(f"❌ Error con {modelo}: {str(e)}")
+            continue
+    return "❌ No se pudo obtener respuesta del asistente IA", None
+# ============= GENERAR AUDIO DE LA RESPUESTA =============
+def generar_audio_respuesta(texto, client):
+    """Convierte la respuesta de texto a audio usando TTS de Hugging Face"""
+    modelos_tts = [
+        "espnet/kan-bayashi_ljspeech_vits",
+        "facebook/mms-tts-spa",
+        "microsoft/speecht5_tts"
     ]
+    # Limitar texto para TTS (máximo 500 caracteres)
+    texto_corto = texto[:500] if len(texto) > 500 else texto
+    for modelo in modelos_tts:
         try:
+            print(f"🔊 Generando audio con: {modelo}")
+            audio = client.text_to_speech(
+                text=texto_corto,
                 model=modelo
             )
+            # Guardar audio
+            timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
+            audio_path = f"respuesta_audio_{timestamp}.wav"
+            with open(audio_path, "wb") as f:
+                f.write(audio)
+            print(f"✅ Audio generado: {audio_path}")
+            return audio_path
         except Exception as e:
+            print(f"❌ Error generando audio con {modelo}: {str(e)}")
+            continue
+    return None
 # ============= ANALIZAR CON LLM Y CONVERTIR A JSON =============
 def analizar_y_convertir_json(texto):
                     gr.Markdown("### Subir Factura PDF")
                     pdf_input = gr.File(label="Seleccionar factura PDF", file_types=[".pdf"], type="filepath")
                     btn_extraer = gr.Button("🚀 Extraer Datos de la Factura", variant="primary", size="lg")
+                    # Indicador de carga para extracción
+                    loading_extraccion = gr.HTML(visible=False, value="""
+                        <div style="text-align: center; padding: 20px;">
+                            <div class="spinner"></div>
+                            <p style="margin-top: 10px; color: #2196F3; font-weight: bold;">
+                                🔄 Procesando tu factura...
+                            </p>
+                            <audio autoplay loop>
+                                <source src="https://assets.mixkit.co/active_storage/sfx/2869/2869-preview.mp3" type="audio/mpeg">
+                            </audio>
+                        </div>
+                        <style>
+                            .spinner {
+                                border: 4px solid #f3f3f3;
+                                border-top: 4px solid #2196F3;
+                                border-radius: 50%;
+                                width: 40px;
+                                height: 40px;
+                                animation: spin 1s linear infinite;
+                                margin: 0 auto;
+                            }
+                            @keyframes spin {
+                                0% { transform: rotate(0deg); }
+                                100% { transform: rotate(360deg); }
+                            }
+                        </style>
+                    """)
                     gr.Markdown("---")
                     csv_output = gr.File(label="📥 Descargar CSV generado")
                     gr.Markdown("---")
                         with gr.Tab("Más información"):
                             resumen_tecnico = gr.Markdown(label="Estructura de datos y metadatos")
+        # ============= TAB 2: ASISTENTE IA CON VOZ =============
+        with gr.Tab("🤖 Asistente IA con Voz"):
             gr.Markdown("""
+            # 💬 Pregúntale al Asistente IA sobre tu Factura
+            ### El asistente puede:
+            - ✅ Responder preguntas específicas sobre tu factura
+            - ✅ Explicar conceptos contables (IVA, base imponible, etc.)
+            - ✅ Dar consejos sobre gestión y pagos
+            - ✅ **Leer la respuesta en voz alta** 🔊
             """)
             with gr.Row():
                 with gr.Column(scale=1):
                     pregunta_ia = gr.Textbox(
+                        label="💭 Tu pregunta o consulta",
+                        placeholder="Escribe tu pregunta aquí...",
+                        value="¿Cuál es el total de esta factura y cuándo debería pagarla?",
+                        lines=4
                     )
+                    btn_consulta_ia = gr.Button("🎤 Consultar y Escuchar Respuesta", variant="primary", size="lg")
+                    # Indicador de carga para IA
+                    loading_ia = gr.HTML(visible=False, value="""
+                        <div style="text-align: center; padding: 20px;">
+                            <div class="spinner-ia"></div>
+                            <p style="margin-top: 10px; color: #9C27B0; font-weight: bold;">
+                                🧠 El asistente IA está pensando...
+                            </p>
+                            <audio autoplay loop>
+                                <source src="https://assets.mixkit.co/active_storage/sfx/2571/2571-preview.mp3" type="audio/mpeg">
+                            </audio>
+                        </div>
+                        <style>
+                            .spinner-ia {
+                                border: 4px solid #f3f3f3;
+                                border-top: 4px solid #9C27B0;
+                                border-radius: 50%;
+                                width: 50px;
+                                height: 50px;
+                                animation: spin 0.8s linear infinite;
+                                margin: 0 auto;
+                            }
+                        </style>
+                    """)
+                    gr.Markdown("---")
+                    gr.Markdown("#### 💡 Ejemplos de preguntas:")
                     gr.Markdown("""
+                    **Preguntas sobre datos:**
                     - ¿Cuál es el total de la factura?
+                    - ¿Quién emitió esta factura?
                     - ¿Cuál es el número de factura?
+                    **Explicación de conceptos:**
+                    - ¿Qué es la base imponible?
+                    - ¿Por qué se aplica IVA?
+                    - ¿Qué significa "exento de IVA"?
+                    **Consejos y recomendaciones:**
+                    - ¿Cuándo debería pagar esta factura?
+                    - ¿Qué debo revisar en esta factura?
+                    - ¿Cómo organizo mis facturas?
                     """)
                 with gr.Column(scale=2):
+                    gr.Markdown("### 📝 Respuesta del Asistente")
+                    resultado_ia = gr.Markdown(
+                        label="Respuesta",
+                        value="*Haz una pregunta y el asistente te responderá aquí...*"
                     )
                     gr.Markdown("---")
+                    gr.Markdown("### 🔊 Escucha la Respuesta")
+                    audio_respuesta = gr.Audio(
+                        label="Audio de la respuesta",
+                        type="filepath",
+                        visible=True
+                    )
+                    gr.Markdown("""
+                    💡 **Tip:** El asistente genera un archivo de audio que puedes:
+                    - ▶️ Reproducir directamente aquí
+                    - 📥 Descargar para escucharlo después
+                    - 🔄 Hacer nuevas preguntas cuando quieras
                     """)
     gr.Markdown("---")
     gr.Markdown("""
+    ### 📚 Guía rápida de uso
+    1. **📄 Extracción Automática:** Sube tu PDF y extrae todos los datos automáticamente
+    2. **🤖 Asistente IA con Voz:** Haz preguntas y escucha las respuestas en audio
+    ---
+    ### 🎯 Características del Asistente IA:
+    - **🧠 Inteligente:** Entiende tu pregunta en lenguaje natural
+    - **📖 Educativo:** Explica conceptos contables de forma sencilla
+    - **💡 Útil:** Da consejos prácticos sobre gestión de facturas
+    - **🔊 Accesible:** Convierte la respuesta a audio automáticamente
+    - **⚡ Rápido:** Responde en segundos
+    💡 **Empieza por la pestaña "Extracción Automática" para procesar tu factura.**
     """)
     # ============= CONECTAR EVENTOS =============
+    # Extracción automática con loading
+    def procesar_con_loading(pdf_file):
+        if pdf_file is None:
+            return "", None, None, "", "", None, None, None, gr.update(visible=False)
+        # Mostrar loading
+        yield "", None, None, "", "", None, None, None, gr.update(visible=True)
+        # Procesar factura
+        time.sleep(0.5)  # Pequeña pausa para que se vea el loading
+        resultado = procesar_factura(pdf_file)
+        # Ocultar loading y mostrar resultados
+        yield (*resultado, gr.update(visible=False))
     btn_extraer.click(
+        fn=procesar_con_loading,
         inputs=[pdf_input],
         outputs=[texto_extraido, tabla_preview, csv_output, resumen_tecnico, info_util,
+                datos_json_state, csv_file_state, pdf_path_state, loading_extraccion]
     )
     # Generar PDF
         outputs=[pdf_output, pdf_status]
     )
+    # Asistente IA con voz y loading
+    def consultar_ia_con_loading(texto, pregunta):
         if not texto:
+            return "❌ Por favor, procesa una factura primero en la pestaña 'Extracción Automática'", None, gr.update(visible=False)
+        # Mostrar loading
+        yield "🔄 Consultando al asistente IA...", None, gr.update(visible=True)
+        # Procesar consulta
+        respuesta, audio = asistente_ia_factura(texto, pregunta)
+        # Ocultar loading y mostrar resultados
+        yield respuesta, audio, gr.update(visible=False)
+    btn_consulta_ia.click(
+        fn=consultar_ia_con_loading,
+        inputs=[texto_extraido, pregunta_ia],
+        outputs=[resultado_ia, audio_respuesta, loading_ia]
     )
 if __name__ == "__main__":