当前位置:首页|资讯|AI大模型|阿尔特曼|百度

AI大模型识别不同的奥特曼

作者:shen名之下发布时间:2024-05-11


AI大模型识别奥特曼主要有以下几个步骤:

  1. 不同的奥特曼的图片收集

  2. 根据数据集训练大模型

  3. 采用语音分割模型,做奥特曼分割

  4. 每一个分割的奥特曼图片做目标分类检测

  5. 将数据还原到图片上

一.奥特曼的图片收集

为了收集图片,写了一个爬虫程序去百度上抓奥特曼的图片

我抓取了艾克斯,迪迦,格罗布,杰克,赛文,泰罗六种奥特曼,每种奥特曼100-200张图片,作为数据集,用于模型训练

把所有图片分类存放,成这样

二.训练识别奥特曼的大模型

数据集划分

写一个代码,将所有的数据集图片,按照9:1的比例,划分训练集图片和验证集图片

预训练模型

我采用resnet50构架做大模型训练,只保存最好的权重模型

至此,已经拿到了.pth的模型文件以及对应的奥特曼分类文件class.txt

三.开始奥特曼的图片识别

人体识别

我们拿到的图片,可能不只有一个奥特曼,所以需要找出每一个奥特曼,为了方便我直接使用现有的fasterrcnn_resnet50_fpn模型

调用自己训练的奥特曼模型,做奥特曼识别

最后,用一个main文件整合流程

看下最后的效果

我们检测的图片

检测后的图片



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1