On-policy self-distillation (OPSD) provides a denser supervision signal for model training compar..., Sonic AI

Use with Claude or ChatGPT

On-policy self-distillation (OPSD) provides a denser supervision signal for model training compar..., Sonic AI