interact.py

from tabulate import tabulate
tabulate.PRESERVE_WHITESPACE = True
from utils.helper import EOS_ID
from models.pplm import latent_perturb
from utils.utils_sample import scorer
import torch.nn.functional as F
import torch


def top_k_logits(logits, k, probs=False):
    """
    Masks everything but the k top entries as -infinity (1e10).
    Used to mask logits such that e^-infinity -> 0 won't contribute to the
    sum of the denominator.
    """
    if k == 0:
        return logits
    else:
        values = torch.topk(logits, k)[0]
        batch_mins = values[:, -1].view(-1, 1).expand_as(logits)
        if probs:
            return torch.where(logits < batch_mins, torch.ones_like(logits) * 0.0, logits)
        return torch.where(logits < batch_mins, torch.ones_like(logits) * -1e10, logits)

def sample(model, args, classifier, context=None, past=None, device='cuda',
                       sample=True, repetition_penalty=1.0):
    output = torch.tensor(context, device=device, dtype=torch.long) if context else None
    output_response = output.new_zeros([output.size(0),0])
    stopped = [0 for _ in range(output.size(0))]
    for i in range(args.length):

        if past is None and output is not None:
            prev = output[:, -1:]
            _, past = model(output[:, :-1])

        logits, past = model(prev, past=past)

        logits = logits[:, -1, :] / args.temperature  # + SmallConst
        for i_o, o_ in enumerate(output):
            for token_idx in set(o_.tolist()):
                if logits[i_o, token_idx] < 0:
                    logits[i_o, token_idx] *= repetition_penalty
                else:
                    logits[i_o, token_idx] /= repetition_penalty

        logits = top_k_logits(logits, k=args.top_k)  # + SmallConst
        log_probs = F.softmax(logits, dim=-1)

        if sample:
            prev = torch.multinomial(log_probs, num_samples=1)
        else:
            _, prev = torch.topk(log_probs, k=1, dim=-1)

        output = prev if output is None else torch.cat((output, prev), dim=1)  # update output
        output_response = torch.cat((output_response, prev), dim=1)

        for i_p, p in enumerate(prev.tolist()):
            if(p[0]) == EOS_ID:
                stopped[i_p] = 1

        if(all(x == 1 for x in stopped)): break

    return output_response


def interact(args,model,enc,classifier,class2idx,speaker,device,logger):
    history = []
    while True:
        raw_text = input("USR >>> ")
        while not raw_text:
            print('Prompt should not be empty!')
            raw_text = input("USR >>>")
        history.append(raw_text)

        context_tokens = sum([enc.encode(h) + [EOS_ID] for h in history],[]) 
        context_tokens = [context_tokens for _ in range(args.num_samples)]


        if(speaker=="PPLM"): 
            original_sentence, perturb_sentence, _, loss, _ = latent_perturb(model=model, enc=enc, 
                                                                            args=args, context=context_tokens,
                                                                            device=device,repetition_penalty=args.repetition_penalty,
                                                                            classifier=classifier.classifier_head)
            spk_turn = {"text":perturb_sentence.tolist()}
        else: 
            original_sentence = sample(model=model,args=args, context=context_tokens, device=device,
                                classifier=classifier.classifier_head, repetition_penalty=args.repetition_penalty,
                                )
            spk_turn = {"text":original_sentence.tolist()}
        hypotesis, _, _ = scorer(args,spk_turn,classifier,enc,class2idx,knowledge=None,plot=False)
        text = hypotesis[0][-1]

        print(f"SYS >>> {text}")
        history.append(text)
        history = history[-(2*args.max_history+1):]