Python的随机种子
在Python程序中,随机种子(seed)与伪随机数生成器(Pseudo-Random Number Generator, PRNG)有关。PRNG是一种算法,它使用一个初始值(即种子)来生成一系列看似随机的数字。这些数字实际上是确定性的,因为相同的种子将总是产生相同的数字序列。这在需要可重复性的情况下非常有用,比如在模拟、游戏或测试时。
在Python中,random模块提供了生成伪随机数的功能。你可以通过调用random.seed()函数来设置种子。如果你不显式地设置种子,random模块通常会使用系统时间或操作系统提供的随机源来初始化种子,这样每次运行程序时都会得到不同的随机 ...
计算机相关顶会
会议简称
会议全称
出版社
网址
AAAI
AAAI Conference on Artificial Intelligence
AAAI
链接
NeurIPS
Annual Conference on Neural Information Processing Systems
MIT Press
链接
ACL
Annual Meeting of the Association for Computational Linguistics
ACL
链接
CVPR
IEEE Conference on Computer Vision and Pattern Recognit ...
图像检索数据集
数据是一切算法应用的基础,无论是监督学习需要标注好的数据进行训练,还是无监督学习需要对数据进行分析、考量,数据都是不可或缺的。一个任务或一项工程的大力度推进或发展离不开公开数据集的构建,重复的进行数据采集、标注是耗费人力和物力的,并且同一任务在不同数据集上的比较也是毫无意义的,所以公开数据集是十分重要的基础架构。
目前做CBIR用得比较多且流行的有下面几个:
手写数字图像库[MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges,这个库有共70,000张图片,每张图片的大小是28* ...
本地/服务器部署大语言模型
本博客以Llama3.2 的1B-Instruct版本为例,在远程服务器上部署模型(和在本地部署类似)。服务器为X86 Ubuntu系统
首先安装必要的环境如torch和transformers等
Llama3版本的模型权重和分词器需要申请,因此首先去HuggingFace的meta官方处申请使用模型,也可以直接下载第三方模型;
申请通过后,在“Files and versions”中下载模型文件.safetensor和配置文件.json到本地,这一步也可以直接通过git或代码中访问远程仓库下载,但需要远程服务器附魔;
文件下载完成后,本地打包上传至服务器目录/home/user ...
safetensors
safetensors是Huggingface推出的一种可靠、易移植的机器学习模型存储格式,用于安全地存储Tensor,而且速度很快(零拷贝)。
safetensors 格式结构:
8 bytes:一个无符号的整数,表示 header 占的字节数
N bytes:JSON UTF-8 字符串,存储 header 的内容,形如:
12345678910111213{ '__metadata__': {'format': 'pt'}, 'model.layers.0. ...