Spaces:

Ahmadzei
/

RAG

Runtime error

App Files Files Community

RAG / chunked /content_aware_chunking /_accelerate /chunk_3.txt

Ahmadzei

update 1

57bdca5 over 1 year ago

raw

history blame contribute delete

2.34 kB

	This includes your training and evaluation DataLoaders, a model and an optimizer:

	train_dataloader, eval_dataloader, model, optimizer = accelerator.prepare(
	train_dataloader, eval_dataloader, model, optimizer
	)

	Backward
	The last addition is to replace the typical loss.backward() in your training loop with 🤗 Accelerate's [~accelerate.Accelerator.backward]method:

	for epoch in range(num_epochs):
	for batch in train_dataloader:
	outputs = model(**batch)
	loss = outputs.loss
	accelerator.backward(loss)

	optimizer.step()
	lr_scheduler.step()
	optimizer.zero_grad()
	progress_bar.update(1)

	As you can see in the following code, you only need to add four additional lines of code to your training loop to enable distributed training!

	+ from accelerate import Accelerator
	from transformers import AdamW, AutoModelForSequenceClassification, get_scheduler

	accelerator = Accelerator()

	model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)
	optimizer = AdamW(model.parameters(), lr=3e-5)

	device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")

	model.to(device)

	train_dataloader, eval_dataloader, model, optimizer = accelerator.prepare(

	train_dataloader, eval_dataloader, model, optimizer
	)

	num_epochs = 3
	num_training_steps = num_epochs * len(train_dataloader)
	lr_scheduler = get_scheduler(
	"linear",
	optimizer=optimizer,
	num_warmup_steps=0,
	num_training_steps=num_training_steps
	)
	progress_bar = tqdm(range(num_training_steps))
	model.train()
	for epoch in range(num_epochs):
	for batch in train_dataloader:

	outputs = model(**batch)
	loss = outputs.loss

	+ accelerator.backward(loss)
	optimizer.step()
	lr_scheduler.step()
	optimizer.zero_grad()
	progress_bar.update(1)

	Train
	Once you've added the relevant lines of code, launch your training in a script or a notebook like Colaboratory.
	Train with a script
	If you are running your training from a script, run the following command to create and save a configuration file:

	accelerate config
	Then launch your training with:

	accelerate launch train.py
	Train with a notebook
	🤗 Accelerate can also run in a notebook if you're planning on using Colaboratory's TPUs.