Sophilex's Blog
  • Home
  • Archive
  • Category
  • Tags
  • About me
  • Friends
各类基于决策单调性的dp优化

各类基于决策单调性的dp优化

从入门到入土的知识点都在这里了:)
2023-12-19
动态规划
#学习笔记 #动态规划 #算法
Training-Inference Mismatch In LLM KD

Training-Inference Mismatch In LLM KD

一个有趣的现象
2025-06-24
slides
#LLM #KD
群作用

群作用

学校的抽代课不讲群作用是我没想到的,恕我直言这个东西真的有点神奇
2023-12-19
抽象代数
#学习笔记 #抽象代数
Burnside 引理

Burnside 引理

对Burnside引理的引入以及其在组合计数方面的应用,在竞赛界会用的比较多
2023-12-18
抽象代数
#学习笔记 #抽象代数
SVD Decompositon in LLM Compression

SVD Decompositon in LLM Compression

事情似乎并没有那么简单...
2025-07-15
slides
#LLM #Compression #SVD
DipSVD: Dual-importance Protected SVD for Efficient LLM Compression

DipSVD: Dual-importance Protected SVD for Efficient LLM Compression

根据每一层的重要性和可压缩程度自适应地分配矩阵压缩率
2025-07-07
学习笔记
#LLM #Matrix_Decomposition
SVD-LLM: TRUNCATION-AWARE SINGULAR VALUE DECOMPOSITION FOR LARGE LANGUAGE MODEL COMPRESSION

SVD-LLM: TRUNCATION-AWARE SINGULAR VALUE DECOMPOSITION FOR LARGE LANGUAGE MODEL COMPRESSION

引入Cholesky decomposition,从理论上保证丢弃的奇异值与loss值一一对应
2025-07-07
学习笔记
#LLM #KD
LANGUAGE MODEL COMPRESSION WITH WEIGHTED  LOW-RANK FACTORIZATION

LANGUAGE MODEL COMPRESSION WITH WEIGHTED LOW-RANK FACTORIZATION

引入Fisher information,在SVD分解时对参数进行加权,以及讨论LLM Compression的常见路线
2025-07-07
学习笔记
#LLM #Matrix_Decomposition
ASVD: ACTIVATION-AWARE SINGULAR VALUE DECOMPOSITION FOR COMPRESSING LARGE LANGUAGE  MODELS

ASVD: ACTIVATION-AWARE SINGULAR VALUE DECOMPOSITION FOR COMPRESSING LARGE LANGUAGE MODELS

引入关于input的信息辅助SVD分解
2025-07-07
学习笔记
#LLM #Matrix_Decomposition
Dual-Space Knowledge Distillation for Large Language Models

Dual-Space Knowledge Distillation for Large Language Models

尝试解决当前llm白盒蒸馏框架下只能对同词汇表模型之间进行蒸馏的局限
2025-06-23
学习笔记
#LLM #KD
1234

搜索

Hexo Fluid
京ICP证123456号 | police-icon 京公网安备12345678号
载入天数... 载入时分秒...