AI大模型识别奥特曼主要有以下几个步骤:
不同的奥特曼的图片收集
根据数据集训练大模型
采用语音分割模型,做奥特曼分割
每一个分割的奥特曼图片做目标分类检测
将数据还原到图片上
为了收集图片,写了一个爬虫程序去百度上抓奥特曼的图片
我抓取了艾克斯,迪迦,格罗布,杰克,赛文,泰罗六种奥特曼,每种奥特曼100-200张图片,作为数据集,用于模型训练
把所有图片分类存放,成这样
数据集划分
写一个代码,将所有的数据集图片,按照9:1的比例,划分训练集图片和验证集图片
预训练模型
我采用resnet50构架做大模型训练,只保存最好的权重模型
至此,已经拿到了.pth的模型文件以及对应的奥特曼分类文件class.txt
人体识别
我们拿到的图片,可能不只有一个奥特曼,所以需要找出每一个奥特曼,为了方便我直接使用现有的fasterrcnn_resnet50_fpn模型
调用自己训练的奥特曼模型,做奥特曼识别
最后,用一个main文件整合流程
看下最后的效果
我们检测的图片
检测后的图片