Treinar LLMs para serem ‘maus’ pode torná-los mais ‘bonzinhos’ a longo prazo?

Um estudo inovador sugere que expor LLMs à 'maldade' durante o treinamento pode, surpreendentemente, melhorar seu comportamento a longo prazo. Entenda essa reviravolta e seus impactos.