Spaces:

javiervz
/

RAG-SA

Running

App Files Files Community

javiervz commited on 5 days ago

Commit

c9a645f

verified ·

1 Parent(s): 143fc02

Update rag_hf.py

Browse files

Files changed (1) hide show

rag_hf.py +35 -28

rag_hf.py CHANGED Viewed

@@ -101,7 +101,7 @@ st.markdown("""
 </style>
 """, unsafe_allow_html=True)
-# === CORE FUNCTIONS ===
 @st.cache_resource(show_spinner="Cargando modelos de IA y grafos de conocimiento...")
 def load_all_components():
     embedder = SentenceTransformer(EMBEDDING_MODEL, device=DEVICE)
@@ -117,6 +117,7 @@ def load_all_components():
     methods[label] = (matrix, id_map, G, rdf)
     return methods, embedder
 def get_top_k(matrix, id_map, query, k, embedder):
     vec = embedder.encode(f"query: {query}", convert_to_tensor=True, device=DEVICE)
     vec = vec.cpu().numpy().astype("float32")
@@ -145,29 +146,9 @@ def query_rdf(rdf, lang_id):
     except Exception as e:
         return [("error", str(e))]
-def query_llm(prompt):
-    try:
-        res = requests.post(
-            ENDPOINT_URL,
-            headers={"Authorization": f"Bearer {HF_API_TOKEN}", "Content-Type": "application/json"},
-            json={"inputs": prompt}, timeout=30
-        )
-        res.raise_for_status()
-        out = res.json()
-        if isinstance(out, list):
-            if len(out) > 0 and isinstance(out[0], dict) and "generated_text" in out[0]:
-                return out[0]["generated_text"].strip()
-        elif isinstance(out, dict) and "generated_text" in out:
-            return out["generated_text"].strip()
-        elif isinstance(out, dict) and "text" in out:
-            return out["text"].strip()
-        return "Sin respuesta del modelo."
-    except Exception as e:
-        return f"Error al consultar el modelo: {str(e)}"
 # === PROMPT PARA MODELO MISTRAL ===
-def generate_response(matrix, id_map, G, rdf, user_question, k=3):
-    ids = get_top_k(matrix, id_map, user_question, k)
     context = [get_context(G, i) for i in ids]
     rdf_facts = []
     for i in ids:
@@ -233,21 +214,27 @@ Answer:
     except Exception as e:
         return f"Error al consultar el modelo: {str(e)}", ids, context, rdf_facts
-# === UI MAIN ===
 def main():
     methods, embedder = load_all_components()
     st.markdown("""
     <div class="header">
         <h1>🌍 Atlas de Lenguas: Lenguas Indígenas Sudamericanas</h1>
     </div>
     """, unsafe_allow_html=True)
     with st.sidebar:
         st.markdown("### 📚 Información de Contacto")
         st.markdown("""
         - <span class="tech-badge">Correo: jxvera@gmail.com</span>
         """, unsafe_allow_html=True)
         st.markdown("---")
         st.markdown("### 🚀 Inicio Rápido")
         st.markdown("""
@@ -264,20 +251,37 @@ def main():
             "¿Cuáles idiomas están relacionados con el Quechua?",
             "¿Dónde se habla el Mapudungun?"
         ]
         for q in questions:
             if st.button(q, key=f"suggested_{q}", use_container_width=True):
                 st.session_state.query = q
         st.markdown("---")
         st.markdown("### 📊 Parámetros de Análisis")
         k = st.slider("Número de idiomas a analizar", 1, 10, 3)
         st.markdown("---")
         st.markdown("### 🔧 Opciones Avanzadas")
         show_ctx = st.checkbox("Mostrar información de contexto", False)
         show_rdf = st.checkbox("Mostrar hechos estructurados", False)
     st.markdown("### 📝 Haz una pregunta sobre lenguas indígenas")
     query = st.text_input(
         "Ingresa tu pregunta:",
         value=st.session_state.get("query", ""),
@@ -289,11 +293,14 @@ def main():
         if not query:
             st.warning("Por favor, ingresa una pregunta")
             return
         label = "LinkGraph"
         method = methods[label]
         start = datetime.datetime.now()
-        response, lang_ids, context, rdf_data = generate_response(*method, query, k)
         duration = (datetime.datetime.now() - start).total_seconds()
         st.markdown(f"""
         <div class="response-card">
             {response}
@@ -317,7 +324,7 @@ def main():
     st.markdown("""
     <div style="font-size: 0.8rem; color: #64748b; text-align: center;">
     <b>📌 Nota:</b> Esta herramienta está diseñada para investigadores, lingüistas y preservacionistas culturales.
-      Para mejores resultados, usa preguntas específicas sobre idiomas, familias o regiones.
     </div>
     """, unsafe_allow_html=True)

 </style>
 """, unsafe_allow_html=True)
+# === CARGA COMPONENTES ===
 @st.cache_resource(show_spinner="Cargando modelos de IA y grafos de conocimiento...")
 def load_all_components():
     embedder = SentenceTransformer(EMBEDDING_MODEL, device=DEVICE)
     methods[label] = (matrix, id_map, G, rdf)
     return methods, embedder
+# === FUNCIONES BASE ===
 def get_top_k(matrix, id_map, query, k, embedder):
     vec = embedder.encode(f"query: {query}", convert_to_tensor=True, device=DEVICE)
     vec = vec.cpu().numpy().astype("float32")
     except Exception as e:
         return [("error", str(e))]
 # === PROMPT PARA MODELO MISTRAL ===
+def generate_response(matrix, id_map, G, rdf, user_question, k, embedder):
+    ids = get_top_k(matrix, id_map, user_question, k, embedder)
     context = [get_context(G, i) for i in ids]
     rdf_facts = []
     for i in ids:
     except Exception as e:
         return f"Error al consultar el modelo: {str(e)}", ids, context, rdf_facts
+# === MAIN ===
 def main():
     methods, embedder = load_all_components()
     st.markdown("""
     <div class="header">
         <h1>🌍 Atlas de Lenguas: Lenguas Indígenas Sudamericanas</h1>
     </div>
     """, unsafe_allow_html=True)
+    with st.expander("📌 **Resumen General**", expanded=True):
+        st.markdown("""
+        Esta aplicación ofrece **análisis impulsado por IA, Grafos y RAGs (GraphRAGs)** de lenguas indígenas de América del Sur,
+        integrando información de **Glottolog, Wikipedia y Wikidata**.
+        """)
     with st.sidebar:
         st.markdown("### 📚 Información de Contacto")
         st.markdown("""
         - <span class="tech-badge">Correo: jxvera@gmail.com</span>
         """, unsafe_allow_html=True)
         st.markdown("---")
         st.markdown("### 🚀 Inicio Rápido")
         st.markdown("""
             "¿Cuáles idiomas están relacionados con el Quechua?",
             "¿Dónde se habla el Mapudungun?"
         ]
         for q in questions:
             if st.button(q, key=f"suggested_{q}", use_container_width=True):
                 st.session_state.query = q
+        st.markdown("---")
+        st.markdown("### ⚙️ Detalles Técnicos")
+        st.markdown("""
+        - <span class="tech-badge">Embeddings</span> GraphSAGE
+        - <span class="tech-badge">Modelo de Lenguaje</span> Mistral (Inference Endpoint)
+        - <span class="tech-badge">Grafo de Conocimiento</span> Integración basada en RDF
+        """, unsafe_allow_html=True)
+        st.markdown("---")
+        st.markdown("### 📂 Fuentes de Datos")
+        st.markdown("""
+        - **Glottolog** (Clasificación de idiomas)
+        - **Wikipedia** (Resúmenes textuales)
+        - **Wikidata** (Hechos estructurados)
+        """)
         st.markdown("---")
         st.markdown("### 📊 Parámetros de Análisis")
         k = st.slider("Número de idiomas a analizar", 1, 10, 3)
         st.markdown("---")
         st.markdown("### 🔧 Opciones Avanzadas")
         show_ctx = st.checkbox("Mostrar información de contexto", False)
         show_rdf = st.checkbox("Mostrar hechos estructurados", False)
     st.markdown("### 📝 Haz una pregunta sobre lenguas indígenas")
+    st.markdown("*(Puedes preguntar en español o inglés, y el modelo responderá en **ambos idiomas**.)*")
     query = st.text_input(
         "Ingresa tu pregunta:",
         value=st.session_state.get("query", ""),
         if not query:
             st.warning("Por favor, ingresa una pregunta")
             return
         label = "LinkGraph"
         method = methods[label]
         start = datetime.datetime.now()
+        response, lang_ids, context, rdf_data = generate_response(*method, query, k, embedder)
         duration = (datetime.datetime.now() - start).total_seconds()
         st.markdown(f"""
         <div class="response-card">
             {response}
     st.markdown("""
     <div style="font-size: 0.8rem; color: #64748b; text-align: center;">
     <b>📌 Nota:</b> Esta herramienta está diseñada para investigadores, lingüistas y preservacionistas culturales.
+    Para mejores resultados, usa preguntas específicas sobre idiomas, familias o regiones.
     </div>
     """, unsafe_allow_html=True)