ICP多媒体数据传输
ICP上多媒体数据的传输问题,大致分两种:
一种是多媒体文件的直接传输,比如图像文件.jpg,.bpg,视频文件.mp4,.mkv,文本文件.txt和语音文件.mp3等。这种类型的传输比较简单,和图像传输一样,程序里规定一次传输的数据量,然后编码传输即可。
第二种是以直播形式进行的实时视频或者语音传输,这种方式也有两种解决思路。第一种是用程序编码数据然后传输,这种方式比较简单,只需要在python中调用API即可,问题在于比如对于视频传输,每一帧压缩后的数据量不同,那么在SDR上的数据帧很难定义(但也不是完全没办法),总之,这种方式不够灵活。第二种是用多媒体软件自带的推流功能,比如VL ...
SDR的架构及相关术语
外差和超外差 无线电发射机有两种主要架构——一种是从基带频率直接调制到射频频率(称为外差),而第二种超外差是通过两个调制阶段来实现这种转换:第一个是从基带到中频(IF),第二个是从中频到射频(RF)。
采样率的影响 SDR中数字处理元件可以实现的采样率,特别是无线电的ADC和DAC的采样率,决定了无线电的实现方式——特别是哪些部分可以实现数字,哪些部分需要模拟电路。这是因为数字处理只能在满足奈奎斯特准则的情况下使用,换句话说,当采样率大于信号中存在的最大频率分量的两倍时,根据用于传输信号的射频频带,有可能实现所有调制和解调的数字化,具体而言,如果满足下面条件:$$f_s>2f_{rf_ ...
FFMPEG基础
FFmpeg介绍 FFmpeg 是一个可以处理音视频的软件,功能非常强大,主要包括,编解码转换,封装格式转换,滤镜特效。同时也支持 各种网络协议,支持 RTMP ,RTSP,HLS 等高层协议的推拉流,也支持更底层一点的TCP/UDP 协议推拉流。
在多平台系统方面,FFmpeg 的兼容性也优势显著,FFmpeg 可以在 windows,Linux,Mac,ios,android 等等操作系统上运行。
因此,可以说 FFmpeg 是音视频领域的瑞士军刀。在多个公司都有使用,例如 Google 的 chrome 里面就使用了 FFmpeg 的库。还有 Youtube,F ...
SR图像数据集
DIV2K DIV2K 数据集源自 NTIRE2017 和 NTIRE2018 超分辨率挑战赛,是图像超分辨率中最流行使用的数据集之一。该数据集由 800 幅训练集图片,100 幅验证集图片和 未公开的100 幅测试集图片组成,每张图片具有 2K 分辨率。
DIV2K 数据集可以从其主页下载。
其中还有以bicubic和unknown方式x2 x4 x8降采样的图像。
Flickr2K 数据大小为20G HR: 2650 张 png ,包含人物、动物、风景 Flickr2K_LR_bicubic: X2、X3、X4,目前缺少 X8 2650 2K images ...
验证损失低于训练损失的总结
项目ing,在利用卷积神经网络压缩1080p图像时,使用DIV2K数据集,遇到验证集损失低于训练集损失的情况,故记录如下。
原因1:在训练中应用正则化,但在验证/测试中未应用正则化 在训练深度神经网络时,经常使用正则化来帮助我们的模型:
获得更高多大验证/测试精度;
理想情况下,为了更好地泛化验证和测试集之外的数据。
正则化方法通常会牺牲训练准确性来提高验证/测试准确性,在某些情况下,可能会导致验证loss低于训练loss。
其次,在验证/测试时不应该使用诸如dropout之类的正则化方法。
原因2:训练loss是在每个epoch ...