Qwen2技术报告

2025-12-03

前言Qwen2的技术报告我大概花了一上午读完了，但是后面评测介绍评测性能的实验分析相关内容并没有细看，只是大致的给过了一眼，重点关注了前面模型架构以及训练部分的创新。 1.主要内容Qwen2系列开源模型，主要包括Base Model(只是预训练，没有进行人类偏好对齐的基础模型) 和针对对话和agent进行单轮和多轮指令微调的指令微调模型，这次发布的稠密模型...

阅读全文

Q-learning及DQN算法

2025-11-25

1.Q-learning 算法核心公式： Q-learning算法是一种免模型的算法，核心思想就是基于价值，实际上就是在填一张状态-价值表，初始化都是为0，基于当前状态，计算出所有动作的reward分数，在$\epsilon$的概率下会选择随机的动作，1-$\epsilon$的概率下会选择最高分数的工作，$\epsilon$会随着学习的过程逐步衰减，这个学...

阅读全文

博士屯TalkShow阅读文献总结

2025-11-23

1.研究性论文-整体内容结构1、Abstract - 了解文章整体核心内容2、Introduction - 问题和贡献3、Related work - 小型综述性介绍4、Method - 框架图5、Experiment - 实验类型 2.综述性论文1、分类2、未来方向 3.阅读重点1、文章解决的问题及方法（或者文章提出的问题）2、可能存在的问题和解决方法3、...

阅读全文

与远端服务器进行文件传输同步的方式总结

2025-10-14

摘要 1、通过git及google网盘直接down到服务器(不推荐) 2、使用Vscode中SFTP插件与服务器进行文件传输 3、使用文件传输工具进行可视化的文件传输 1、通过git及google网盘直接down到服务器(不推荐) 一般服务器都是linux的系统，自带git，当文件不是很大的时候，可以通过先将项...

阅读全文

pyenv + poetry 进行多版本python项目管理方案

2025-10-12

摘要 1、pyenv 管理不同版本的python 2、poetry根据不同的pyenv创建的python版本进行项目环境.venv的创建 1.使用pyenv管理不同版本的python对于pyenv的安装，pyenv官方github提供详细的教程，本文不再涉及，windows系统需要安装的话，可以使用pyenv-win，在github上也有仓库提供。 1 ...

阅读全文