avatar
文章
31
标签
64
分类
4
主页
标签
分类
关于
友情链接
思想是一个锐化的过程
搜索
主页
标签
分类
关于
友情链接

思想是一个锐化的过程

python脚本传入参数
发表于2025-06-19|编程日记
背景    在日常使用一些数据处理脚本以及训练模型的时候,使用传递参数很常见,因此对使用python进行参数传递的方式进行了整理 1.使用sys.argv的数组进行传参使用sys.argv必须按照先后的顺序传入对应的参数;sys.argv则封装了传入的参数数据,作为数组的方式进行传入。 1234567891011import sysprint('传入参数:', sys.argv)print("传入参数的总长度为:", len(sys.argv))print("type:", type(sys.argv))print("function name:", sys.argv[0])try: print("第一个传入的参数为:", sys.argv[1]) print("第二个传入的参数为:", sys.argv[2])except Exception as e: print("Input Error:...
论文阅读笔记---LLM + 图结构信息编码未知实体和关系进行TKGs补全任务
发表于2025-06-15|论文阅读笔记
基于Transformers库的命名实体识别
发表于2025-06-12|AI
step1 导入相关包123import evaluatefrom datasets import load_datasetfrom transformers import AutoTokenizer, AutoModelForTokenClassification, TrainingArguments, Trainer, DataCollatorForTokenClassification step2 加载数据集123from datasets import DatasetDictner_datasets = DatasetDict.load_from_disk("ner_data")ner_datasets 输出:DatasetDict({ train: Dataset({ features: [‘id’, ‘tokens’, ‘ner_tags’], num_rows: 20865 }) validation: Dataset({ features: [‘id’, ‘tokens’, ‘ner_...
编码注意力机制的梳理(自用-分享)
发表于2025-06-09|AI
编码注意力机制的梳理(自用-分享)   目前主流的大语言模型都是基于Transformer架构的,而Transformer架构的核心是Attention机制,所以了解Attention机制对于理解Transformer架构至关重要。 1.长序列建模中问题过去在处理序列文本等数据时,大多采用RNN等模型,虽然部分应用场景下RNN模型的效果不错,但是面对长序列数据时,存在遗忘问题,从而导致对长序列模型建模时效果不是很好。因此,在2017年,Transformer模型应运而生,Transformer模型在长序列建模中,通过引入Attention机制,解决RNN模型中的遗忘问题,并大大提高模型的效果。 2.过去编码器-解码器模型存在问题由于之前编码器-解码器模型,主要还是基于RNN模型,编码器生成整个文本的编码向量,再将这个编码向量输入给解码器,解码器基于编码向量生成输出预测,但是由于存在长距离遗忘信息丢失问题,编码向量会丢失长文本前段的信息,从而导致预测效果不好。然后注意力机制可以很好的解决这个问题,注意力机制可以捕获较长的依赖关系,获得更准确的编码向量表示。 1...
论文阅读笔记---CyGNet阅读笔记-TKG推理任务
发表于2025-06-03|论文阅读笔记
第一次实习及读研一年来心路历程总结
发表于2025-06-03|随笔
python包的安装和环境配置总结
发表于2025-05-28|编程日记
1、查看自己CUDA版本号1nvidia-smi 2. 安装torch\torchvision\torchaudio三大组件包下载管理站1 # 该链接貌似已失效包下载管理站2 # 阿里镜像站可用 首先选择torch,ctrl + F 搜索 [cu102-cp38-cp38-win] 这里cu102 是我们下载的 CUDA 10.2 版本,cp38-cp38 是说我们的 Python 版本是 3.8。如果要安装python3.9那将cp3.8改为cp3.9即可。 需要注意的是 python版本号 CUDA版本号 以及 系统是我们需要的。 3.CONDA环境配置例如: 1conda create -n xxx python=3.9 然后在终端执行命令: 1conda activate xxx 4、pip WHL文件执行下面的命令安装轮子 1pip xxx.whl 以上就是配置环境的简明教程 torch_geometric安装torch_geometric是PyG中必不可少的一个包,也是进行图神经网络学习的必备,然而安装这个包并运行一段简单的代码踩了不少坑,记录一下。 执行以下命令,先...
解决 pip 开了网络代理之后无法安装python包的问题
发表于2025-05-28|编程日记
问题描述:开了网络代理后,无法在终端直接使用pip和conda命令,会报错:12345678910$ pip install netsmLooking in indexes: https://pypi.tuna.tsinghua.edu.cn/simpleWARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLEOFError(8, 'EOF occurred in violation of protocol (_ssl.c:1123)'))': /simple/netsm/WARNING: Retrying (Retry(total=3, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError(SSLEOFE...
vscode上一种优雅的debug方式
发表于2025-05-28|编程日记
vscode 如何debug python torchrun deepspeed[自用,防忘记]⚠️ 写在前面(一定要看) debug程序的方式有很多种。每一种方式都各有缺点:有的方式虽然优雅,但是局限性很大;有的方式麻烦,但是局限性小。 常规方式: 优点:然后可以观察所有线程。一劳永逸。 缺点:就是写参数很麻烦,但是你可以让chatgpt等大模型帮你写。 最最最优雅的方式: 优点:就是需要在代码里面,加入几行代码。方便快捷。 缺点:有时候断点不生效,只能在一个线程里面启动。 建议先使用【常规形式】、如果【常规形式】不够用,再使用【最最最优雅的方式】 B站手把手视频 常规方式:https://www.bilibili.com/video/BV1Hh4y1i7Li 对于torchrun这种形式:https://www.bilibili.com/video/BV1b84y1R75V 对于deepspeed这种形式: https://www.bilibili.com/video/BV1xC4y1P7LH 最最最优雅的方式:https://www.bilibili.co...
1234
avatar
TCcjx
生活给我出难题,我说ok小问题
文章
31
标签
64
分类
4
Follow Me
公告
欢迎志同道合的朋友,一起交流
最新文章
从反向传播角度理解 PPO 损失函数2026-05-04
从底层架构到工程实战:深度拆解生产级 AI Agent 的记忆机制2026-05-02
理解学习率调度(余弦退火 + warmup)的原理和作用2026-04-23
Agent 一线实战:落地经验与 Know-How 分享2026-04-19
CLAUDE.md 文件推荐约束提示词2026-03-10
分类
  • AI13
  • 编程日记10
  • 论文阅读笔记6
  • 随笔2
标签
心路历程 补全推理 注意力机制 TKGs 深度学习 RLHF 强化学习 MRR PyCharm&Vscode 时态知识图谱推理 Memory KVCache debug vscode Qwen2 NER poetry transfomer pyenv Hit@1\3\5\10 glue code Agent 图结构信息 DQN算法 Ubuntu Linux LLMs Claude code 时态知识图谱补全 RL transfomers 清华源 技术报告 python环境管理 private vibe coding LLM contrastive learning 图谱推理任务 pip
归档
  • 五月 2026 2
  • 四月 2026 2
  • 三月 2026 1
  • 十二月 2025 1
  • 十一月 2025 2
  • 十月 2025 3
  • 九月 2025 1
  • 八月 2025 3
  • 七月 2025 2
网站信息
文章数目 :
31
本站总字数 :
24.3k
本站访客数 :
本站总浏览量 :
最后更新时间 :
© 2025 - 2026 By TCcjx框架 Hexo 7.3.0|主题 Butterfly 5.5.4
搜索
数据加载中