JrunDing

发表于2024-09-08|Communication

低空经济是以各种有人驾驶和无人驾驶航空器的各类低空飞行活动为牵引，辐射带动相关领域融合发展的综合性经济形态。低空经济主要以民用有人驾驶和无人驾驶航空器的低空飞行活动为核心，涉及民用/警用/军用、涵盖农业/工业/服务业、贯通制造/飞行/保障/服务，具有“多领域、跨行业、全链条”的特点，通过这些活动带动相关领域的融合发展。这类经济形态涵盖了从地面 1000 米以下，有时甚至延伸至3000 米以下的空域，涉及多种行业和领域。低空经济链点产业研究院将之总结为：三业一态，即航空器制造业、航空飞行业、飞行保障业、综合服务的经济形态 ...

H264和H265的CRF

发表于2024-09-06|Computer Vision

简单说CRF类似JPG中的quality，根据设置的值自动控制质量和压缩率，根据视频内容自动生成每秒码率。在优先保证画面质量（也不太在乎转码时间）的情况下，使用-crf参数来控制转码是比较适宜的。这个参数的取值范围为051，其中0为无损模式，数值越大，画质越差，生成的文件却越小。从主观上讲，1828是一个合理的范围。18被认为是视觉无损的（从技术角度上看当然还是有损的），它的输出视频质量和输入视频相当。 1ffmpeg -i D:\src.mov -c:v libx264 -preset veryslow -crf 18 -c:a copy D:\dest1.mp4 意思 ...

图像标注工具

发表于2024-08-31|Computer Vision

labelme 地址：https://github.com/wkentaro/labelme labelme 是一个基于 python 的开源图像多边形标注工具，可用于手动标注图像以进行对象检测、分割和分类。它是在线 LabelMe 的离线分支，最近关闭了新用户注册选项。所以，在这篇文章中，我们只考虑 labelme（小写）。该工具是具有直观用户界面的轻量级图形应用程序。使用 labelme，您可以创建：多边形、矩形、圆、线、点或线带。通常，能够以众所周知的格式（例如 COCO、YOLO 或 PASCAL VOL）导出注释以供后续使用通常很方便。但是，在 labelme 中， ...

神经网络训练失败的原因

发表于2024-08-31|Deep Learning

在面对模型不收敛的时候，首先要保证训练的次数够多。在训练过程中，loss并不是一直在下降，准确率一直在提升的，会有一些震荡存在。只要总体趋势是在收敛就行。若训练次数够多（一般上千次，上万次，或者几十个epoch）没收敛，再考虑采取措施解决。数据与标签方面没有对数据进行预处理。数据分类标注是否准确？数据是否干净？没有对数据进行归一化。由于不同评价指标往往具有不同的量纲和量纲单位，这样的情况会影响到数据分析的结果，为了消除指标之间的量纲影响，需要进行数据标准化处理，以解决数据指标之间的可比性。原始数据经过数据标准化处理后，各指标处于同一数量级，适合进行综合对比评价。此外，大部分神经网络 ...

深度学习如何训练优秀模型

发表于2024-08-31|Deep Learning

深度学习在近年来得到了广泛的应用，从图像识别、语音识别到自然语言处理等领域都有了卓越的表现。但是，要训练出一个高效准确的深度学习模型并不容易。不仅需要有高质量的数据、合适的模型和足够的计算资源，还需要根据任务和数据的特点进行合理的超参数调整、数据增强和模型微调。数据从数据层面上，能够影响模型性能的有二个因素：数据集的质量数据增强数据集质量数据质量：数据应该是准确，完整，无误，且具有代表性。如果数据集有错误或缺失，将会影响模型的性能，选择分辨率越高肯定对模型是越好的，但是也要考虑到模型训练占用的内存够不够，因为分辨率越高，数据量就越大数据量：更多的数据通常 ...