theodotus
/

DialoGPT-uk

text2text-generation

Model card Files Files and versions Community

theodotus commited on Sep 18, 2022

Commit

1ca335c

·

1 Parent(s): 651c45f

left only answers

Files changed (1) hide show

pipeline.py +7 -4

pipeline.py CHANGED Viewed

@@ -14,13 +14,16 @@ class PreTrainedPipeline():
         self.tokenizer = transformers.AutoTokenizer.from_pretrained("microsoft/DialoGPT-medium")
     def __call__(self, inputs: str) -> List[Dict]:
         text = inputs + self.tokenizer.eos_token
         start_tokens = self.tokenizer.convert_ids_to_tokens(self.tokenizer.encode(text))
         results = self.generator.generate_batch([start_tokens])
         output = results[0].sequences[0]
-        generated_text = self.tokenizer.decode(self.tokenizer.convert_tokens_to_ids(output))
         return [{"generated_text": generated_text}]

         self.tokenizer = transformers.AutoTokenizer.from_pretrained("microsoft/DialoGPT-medium")
     def __call__(self, inputs: str) -> List[Dict]:
+        # Get input tokens
         text = inputs + self.tokenizer.eos_token
         start_tokens = self.tokenizer.convert_ids_to_tokens(self.tokenizer.encode(text))
+        # generate
         results = self.generator.generate_batch([start_tokens])
         output = results[0].sequences[0]
+        # left only answers
+        tokens = self.tokenizer.convert_tokens_to_ids(output)
+        eos_index = tokens.index(self.tokenizer.eos_token_id)
+        answer_tokens = tokens[eos_index+1:]
+        generated_text = self.tokenizer.decode(answer_tokens)
         return [{"generated_text": generated_text}]