Sophilex 2025年6月24日晚上

0 字 1 分钟

Training-Inference Mismatch In LLM KD

View Slides View PDF

slides

#LLM #KD

Training-Inference Mismatch In LLM KD

https://sophilex.github.io/posts/ef9972ec/

作者

Sophilex

发布于

2025年6月24日

许可协议

ASVD: ACTIVATION-AWARE SINGULAR VALUE DECOMPOSITION FOR COMPRESSING LARGE LANGUAGE MODELS 上一篇

Dual-Space Knowledge Distillation for Large Language Models 下一篇