🌓

Qwen2技术报告

前言Qwen2的技术报告我大概花了一上午读完了,但是后面评测介绍评测性能的实验分析相关内容并没有细看,只是大致的给过了一眼,重点关注了前面模型架构以及训练部分的创新。 1.主要内容Qwen2系列开源模型,主要包括Base Model(只是预训练,没有进行人类偏好对齐的基础模型) 和 针对对话和agent进行单轮和多轮指令微调的指令微调模型,这次发布的稠密模型...

阅读全文

Q-learning及DQN算法

1.Q-learning 算法核心公式: Q-learning算法是一种免模型的算法,核心思想就是基于价值,实际上就是在填一张状态-价值表,初始化都是为0,基于当前状态,计算出所有动作的reward分数,在$\epsilon$的概率下会选择随机的动作,1-$\epsilon$的概率下会选择最高分数的工作,$\epsilon$会随着学习的过程逐步衰减,这个学...

阅读全文

博士屯TalkShow阅读文献总结

1.研究性论文-整体内容结构1、Abstract - 了解文章整体核心内容2、Introduction - 问题和贡献3、Related work - 小型综述性介绍4、Method - 框架图5、Experiment - 实验类型 2.综述性论文1、分类2、未来方向 3.阅读重点1、文章解决的问题及方法(或者文章提出的问题)2、可能存在的问题和解决方法3、...

阅读全文

与远端服务器进行文件传输同步的方式总结

摘要 1、通过git及google网盘直接down到服务器(不推荐) 2、使用Vscode中SFTP插件与服务器进行文件传输 3、使用文件传输工具进行可视化的文件传输 1、通过git及google网盘直接down到服务器(不推荐)    一般服务器都是linux的系统,自带git,当文件不是很大的时候,可以通过先将项...

阅读全文

pyenv + poetry 进行多版本python项目管理方案

摘要 1、pyenv 管理不同版本的python 2、poetry根据不同的pyenv创建的python版本进行项目环境.venv的创建 1.使用pyenv管理不同版本的python对于pyenv的安装,pyenv官方github提供详细的教程,本文不再涉及,windows系统需要安装的话,可以使用pyenv-win,在github上也有仓库提供。 1 ...

阅读全文

ssh连接远程服务器及Linux小常识

这是一篇加密文章,需要密码才能继续阅读。

阅读全文

综述(自用)-基于规则方法的时间知识图谱推理(预测)

这是一篇加密文章,需要密码才能继续阅读。

阅读全文

Poetry基本用法教程

1.背景      最近在复现一个项目的时候,发现项目的环境安装是使用Poetry,一脸懵逼,不知道Poetry是什么东西,以前也从来没有接触过。于是开始学习Poetry,一番了解下来,决定专门学习掌握一下Poetry这个包依赖管理工具。 1.1 Poetry是什么?Poetry官网如此写到: 1P...

阅读全文