Fine-tuning Language Models for Structured Responses with QLoRa

I cover fine-tuning of language models to return *structured responses*, e.g. to return function calls, json objects or arrays. Lecture notes here: Fine-tuning for tone or style? *Basic Training Google Colab Notebook (FREE)* Access the Google Colab script here: *ADVANCED Training Notebook for Structured Responses (PAID)* - Includes a prompt loss-mask and stop token for improved performance. Request access here: *Advanced Fine-tuning Repo Access - incl. 5 advanced notebooks* Learn more here: 1. Fine-tuning for structured responses 2. Supervised fine-tuning (best for training “chat“ models) 3. Unsupervised fine-tuning (best for training “base&qu

1 view

709

188