Spaces:

shourya-goenka
/

Tamil_S2T

Sleeping

shourya-goenka commited on Sep 2, 2024

Commit

7422180

verified ·

1 Parent(s): 9993720

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,6 +1,8 @@
 import torch
 from transformers import pipeline
 import json
 transcribe = pipeline(task = "automatic-speech-recognition", model = "vasista22/whisper-tamil-medium", chunk_length_s=30, device="cpu")
 transcribe.model.config.forced_decoder_ids = transcribe.tokenizer.get_decoder_prompt_ids(language="ta", task="transcribe")
@@ -31,6 +33,8 @@ def process_audio(params):
         # text = response['results']['channels'][0]['alternatives'][0]['transcript']
         print(audio)
         text = transcribe(audio)["text"]
         answer_dict = {}

 import torch
 from transformers import pipeline
 import json
+import requests
+from io import BytesIO
 transcribe = pipeline(task = "automatic-speech-recognition", model = "vasista22/whisper-tamil-medium", chunk_length_s=30, device="cpu")
 transcribe.model.config.forced_decoder_ids = transcribe.tokenizer.get_decoder_prompt_ids(language="ta", task="transcribe")
         # text = response['results']['channels'][0]['alternatives'][0]['transcript']
         print(audio)
+        response = requests.get(audio_url)
+        audio = BytesIO(response.content)
         text = transcribe(audio)["text"]
         answer_dict = {}