延迟、带宽、吞吐量和响应时间
延迟:客户端到服务器以及服务器到客户端的传输时间.
带宽:每单位时间可以通过通信通道传输的最大数据量.
吞吐量:在给定时间段内成功从一个地方移动到另一个地方的数据量.注意:数据吞吐量永远不会超过网络带宽。
响应时间:从用户发送请求到应用程序指示请求已完成并返回给用户的时间量。
延迟 延迟,也被称为网络延迟,是指数据从发送端到接收端的传输时间。这个传输时间不仅包括数据包在物理传输媒体上传播的时间,还包括了数据包在网络设备上进行处理的时间,以及在队列中等待处理的时间。延迟通常以毫秒(ms)为单位表示,尽管在某些应用中,更精确的度量也可能以微秒(μs)为单位。
往返时间 (RT ...
下载&部署LLM
Llama 2是今年下半年刚出的LLM,开源且免费商用,因此很有研究部署它的价值,所以这篇博客简单介绍如何下载和部署Llama 2。Llama 2有7B, 13B, 70B三种不同尺寸的模型。
1. Llama 2官方 注:Llama 2官方的模型针对多卡部署,因此不适用于咱们普通用户消费级显卡部署。
Github仓库:https://github.com/facebookresearch/llama
首先注册Llama 2账号:https://ai.meta.com/resources/models-and-libraries/llama-downloads/,这里的邮箱最好和 ...
NVIDIA GPU架构
NVIDIA GPU的架构演变历史和基本概念截止2021年,发布时间离我们最近的8种NVIDIA GPU微架构是:
Tesla
Fermi
Kepler
Maxwell
Pascal
Volta
Turing
Ampere
NVIDIA一般以历史上一些著名科学家的名字命名自己的GPU微架构,上面8种微架构分别是:特斯拉,费米,开普勒,麦克斯韦,帕斯卡,伏打,图灵,安培。
其中最新的是2020年宣布的Ampere架构。
Tesla 架构Tesla 架构的资料在官网也没找到多少,不过这是英伟达第一个实现统一着色器模型的微架构。
经典型号是G80,在Fermi架构白皮书的开篇部分有对G80的简 ...
Labview测试程序运行时间
使用Labview时,为了验证算法的时间复杂度,经常需要测试程序的运行时间,下面是一个简单的测试程序运行时间的例子。
源程序:
现要测试这段程序的执行时间,如下:
使用平铺式顺序结构包住源程序,在其前后分别添加帧,在前后帧中分别添加时间计数器,用后帧减去前帧即可得到程序运行的毫秒数。