FFMPEG基础
FFmpeg介绍 FFmpeg 是一个可以处理音视频的软件,功能非常强大,主要包括,编解码转换,封装格式转换,滤镜特效。同时也支持 各种网络协议,支持 RTMP ,RTSP,HLS 等高层协议的推拉流,也支持更底层一点的TCP/UDP 协议推拉流。
在多平台系统方面,FFmpeg 的兼容性也优势显著,FFmpeg 可以在 windows,Linux,Mac,ios,android 等等操作系统上运行。
因此,可以说 FFmpeg 是音视频领域的瑞士军刀。在多个公司都有使用,例如 Google 的 chrome 里面就使用了 FFmpeg 的库。还有 Youtube,F ...
SR图像数据集
DIV2K DIV2K 数据集源自 NTIRE2017 和 NTIRE2018 超分辨率挑战赛,是图像超分辨率中最流行使用的数据集之一。该数据集由 800 幅训练集图片,100 幅验证集图片和 未公开的100 幅测试集图片组成,每张图片具有 2K 分辨率。
DIV2K 数据集可以从其主页下载。
其中还有以bicubic和unknown方式x2 x4 x8降采样的图像。
Flickr2K 数据大小为20G HR: 2650 张 png ,包含人物、动物、风景 Flickr2K_LR_bicubic: X2、X3、X4,目前缺少 X8 2650 2K images ...
验证损失低于训练损失的总结
项目ing,在利用卷积神经网络压缩1080p图像时,使用DIV2K数据集,遇到验证集损失低于训练集损失的情况,故记录如下。
原因1:在训练中应用正则化,但在验证/测试中未应用正则化 在训练深度神经网络时,经常使用正则化来帮助我们的模型:
获得更高多大验证/测试精度;
理想情况下,为了更好地泛化验证和测试集之外的数据。
正则化方法通常会牺牲训练准确性来提高验证/测试准确性,在某些情况下,可能会导致验证loss低于训练loss。
其次,在验证/测试时不应该使用诸如dropout之类的正则化方法。
原因2:训练loss是在每个epoch ...
常用期刊缩写
Title
Journal/Magazine
Reference Abbreviation
*denotes past acronyms/abbreviations of journals
Access, IEEE
ACCESS
IEEE Access
Aerospace and Electronics Systems Magazine, IEEE
MAES
IEEE Aerosp. Electron. Syst. Mag.
Aerospace and Electronic Systems, IEEE Transactions on
T ...
图像文件格式
重点介绍常用的图像文件格式
首先明确,无论是视频还是图像,编解码器/编解码算法和图像/视频的格式是不同的概念,也不是一一对应的,即一个图像文件格式通常可以使用多种编解码算法进行编码,同时一个编解码算法也可以用于多种不同的图像文件格式。例如,JPEG格式的图像可以使用不同版本的JPEG编解码器进行编码和解码,而同一种JPEG编解码器也可以用于处理其他格式的图像数据,比如在HEIF容器中的JPEG图像。
常用的图像文件格式 位图
JPEG(.jpg、.jpeg):一种常见的有损压缩格式,适合用于存储照片和其他图像。
PNG(.png):一种无损压缩格式,支持透明度 ...