Spaces:

Ahmadzei
/

RAG

Runtime error

added 3 more tables for large emb model

5fa1a76 over 1 year ago

352 Bytes

	def prepare_dataset(batch):
	audio = batch["audio"]
	batch = processor(audio["array"], sampling_rate=audio["sampling_rate"], text=batch["transcription"])
	batch["input_length"] = len(batch["input_values"][0])
	return batch

	To apply the preprocessing function over the entire dataset, use 🤗 Datasets [~datasets.Dataset.map] function.