Spaces:

koyu008
/

Toxic_Comment_Classifier

Running

App Files Files Community

koyu008 commited on 20 days ago

Commit

a3af327

verified ·

1 Parent(s): 2d04c0e

Update app.py

Browse files

Files changed (1) hide show

app.py +24 -35

app.py CHANGED Viewed

@@ -6,7 +6,6 @@ from transformers import DistilBertTokenizer, DistilBertModel, AutoModel, AutoTo
 from langdetect import detect
 from huggingface_hub import snapshot_download
 import os
-from typing import List
 # Device
@@ -86,45 +85,35 @@ app.add_middleware(
 class TextIn(BaseModel):
-    texts: List[str]
 @app.post("/api/predict")
 @app.post("/api/predict")
 def predict(data: TextIn):
-    results = []
-    for text in data.texts:
-        try:
-            lang = detect(text)
-        except:
-            lang = "unknown"
-        if lang == "en":
-            tokenizer = english_tokenizer
-            model = english_model
-            inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True).to(device)
-            with torch.no_grad():
-                outputs = model(**inputs)
-                probs = torch.sigmoid(outputs).squeeze().cpu().tolist()
-            predictions = dict(zip(english_labels, probs))
-        else:
-            tokenizer = hinglish_tokenizer
-            model = hinglish_model
-            inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True).to(device)
-            with torch.no_grad():
-                outputs = model(**inputs)
-                probs = torch.softmax(outputs, dim=1).squeeze().cpu().tolist()
-            predictions = dict(zip(hinglish_labels, probs))
-        results.append({
-            "text": text,
-            "language": lang if lang in ["en", "hi"] else "unknown",
-            "predictions": predictions
-        })
-    return {"results": results}
 @app.get("/")
 def root():

 from langdetect import detect
 from huggingface_hub import snapshot_download
 import os
 # Device
 class TextIn(BaseModel):
+    text: str
 @app.post("/api/predict")
 @app.post("/api/predict")
 def predict(data: TextIn):
+    text = data.text
+    try:
+        lang = detect(text)
+    except:
+        lang = "unknown"
+    if lang == "en":
+        tokenizer = english_tokenizer
+        model = english_model
+        inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True).to(device)
+        with torch.no_grad():
+            outputs = model(**inputs)
+            probs = torch.sigmoid(outputs).squeeze().cpu().tolist()
+        return {"language": "English", "predictions": dict(zip(english_labels, probs))}
+    else:
+        tokenizer = hinglish_tokenizer
+        model = hinglish_model
+        inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True).to(device)
+        with torch.no_grad():
+            outputs = model(**inputs)
+            probs = torch.softmax(outputs, dim=1).squeeze().cpu().tolist()
+        return {"language": "Hinglish", "predictions": dict(zip(hinglish_labels, probs))}
 @app.get("/")
 def root():