图像标注工具
labelme 地址:https://github.com/wkentaro/labelme
labelme 是一个基于 python 的开源图像多边形标注工具,可用于手动标注图像以进行对象检测、分割和分类。它是在线 LabelMe 的离线分支,最近关闭了新用户注册选项。所以,在这篇文章中,我们只考虑 labelme(小写)。
该工具是具有直观用户界面的轻量级图形应用程序。使用 labelme,您可以创建:多边形、矩形、圆、线、点或线带。通常,能够以众所周知的格式(例如 COCO、YOLO 或 PASCAL VOL)导出注释以供后续使用通常很方便。但是,在 labelme 中, ...
神经网络训练失败的原因
在面对模型不收敛的时候,首先要保证训练的次数够多。在训练过程中,loss并不是一直在下降,准确率一直在提升的,会有一些震荡存在。只要总体趋势是在收敛就行。若训练次数够多(一般上千次,上万次,或者几十个epoch)没收敛,再考虑采取措施解决。
数据与标签方面
没有对数据进行预处理。数据分类标注是否准确?数据是否干净?
没有对数据进行归一化。由于不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。此外,大部分神经网络 ...
深度学习如何训练优秀模型
深度学习在近年来得到了广泛的应用,从图像识别、语音识别到自然语言处理等领域都有了卓越的表现。但是,要训练出一个高效准确的深度学习模型并不容易。不仅需要有高质量的数据、合适的模型和足够的计算资源,还需要根据任务和数据的特点进行合理的超参数调整、数据增强和模型微调。
数据 从数据层面上, 能够影响模型性能的有二个因素:
数据集的质量
数据增强
数据集质量 数据质量:数据应该是准确,完整,无误,且具有代表性。如果数据集有错误或缺失,将会影响模型的性能,选择分辨率越高肯定对模型是越好的,但是也要考虑到模型训练占用的内存够不够,因为分辨率越高,数据量就越大
数据量:更多的数据通常 ...
AI算力芯片基础知识
AI芯片是智能计算的核心基础设施,对于大模型和其他人工智能技术的发展起着至关重要的作用。
AI计算是一种计算机器学习算法的数学密集型流程,通过加速系统和软件,从大量数据集中提取新的见解并在此过程中学习新能力。
AI计算的三个主要过程包括:
提取/转换/加载数据(ETL):数据科学家需要整理和准备数据集。
选择或设计AI模型:数据科学家选择或设计最适合其应用的AI模型,一些公司会从一开始就设计并训练自己的模型,另一些公司可能采用预训练模型并根据需求进行自定义。
AI推理:企业通过模型对数据进行筛选,AI在此过程中提供可行的洞察与见解。
算力及AI算力主要芯 ...
视频转码的实时转码和离线转码区别
由于视频的编码格式,封装协议非常多,在视频播放的过程中,会有很多编码不兼容的问题。这种情况下就需要对视频进行转码。
视频转码分为离线转码和实时转码,它们的工作方式和具体的业务要求是完全不同的,其应用的场景也是完全不一样的。所以我们在项目中,如果需要对视频进行转码,需要搞清楚具体的视频转码是要应用在哪种场景下,需要解决什么问题。
离线转码 离线转码的应用非常广泛,我们日常在视频网站追剧,都需要对视频进行转码。还有我们都有这样的经历,从网上下载了一个视频文件,结果无法播放,这都需要对视频进行转码后,让原来的视频适合现有的播放器。
离线转码一般针对视频文件,也就是说我们有一个 ...