Sophilex's Blog
  • Home
  • Archive
  • Category
  • Tags
  • About me
  • Friends
各类基于决策单调性的dp优化

各类基于决策单调性的dp优化

从入门到入土的知识点都在这里了:)
2023-12-19
动态规划
#学习笔记 #动态规划 #算法
Training-Inference Mismatch In LLM KD

Training-Inference Mismatch In LLM KD

一个有趣的现象
2025-06-24
slides
#LLM #KD
群作用

群作用

学校的抽代课不讲群作用是我没想到的,恕我直言这个东西真的有点神奇
2023-12-19
抽象代数
#学习笔记 #抽象代数
Burnside 引理

Burnside 引理

对Burnside引理的引入以及其在组合计数方面的应用,在竞赛界会用的比较多
2023-12-18
抽象代数
#学习笔记 #抽象代数
Data_Parallel

Data_Parallel

对训练数据进行划分,降低单卡显存
2026-06-29
#LLM #分布式训练
Model_Parallel

Model_Parallel

对模型进行划分,多卡训练
2026-06-29
学习笔记
#LLM #分布式训练
ZeRO

ZeRO

分布式训练中的显存优化策略
2026-06-29
学习笔记
#LLM #分布式训练
Connections Between On Policy Distillation And RL

Connections Between On Policy Distillation And RL

OPD可以看成一种特殊的RL,在此基础上对其进行拓展
2026-03-10
学习笔记
#LLM #Compression
Distilling the Essence: Efficient Reasoning Distillation via Sequence Truncation

Distilling the Essence: Efficient Reasoning Distillation via Sequence Truncation

对推理蒸馏在数据层面进行深入分析
2025-12-29
学习笔记
#LLM
Instruction tuning with loss over instructions

Instruction tuning with loss over instructions

有些数据集上对prompt也进行对齐,可以有效防止过拟合
2025-12-29
学习笔记
#LLM
123…7

搜索

Hexo Fluid
京ICP证123456号 | police-icon 京公网安备12345678号
载入天数... 载入时分秒...