数据增广+手势识别[Paddlehub+PaddleX]-人工智能-PHP中文网

数据增广+手势识别[Paddlehub+PaddleX]

P粉084495128

发布： 2025-07-28 10:50:17

原创

699人浏览过

作者为提升手势识别在复杂背景下的准确率，用Paddlehub的deeplabv3p_xception65_humanseg模型抠出手势，与复杂背景图合成增广数据，将“5”手势与其他手势作二分类。增广后“5”的样本从979张增至2988张，再用PaddleX的MobileNetV3_small_ssld模型训练30个epoch，测试效果良好，摄像头实测表现佳。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

数据增广+手势识别[paddlehub+paddlex] - php中文网

使用Paddlehub 和 PaddleX完成数据的增广和训练~

大家好,我是只会心疼giegie的桨师，最近因为想做一个手势相关的小游戏，所以看了一下手势识别。但是目前搜到的数据集中，手势识别的背景都是纯色（纯白或是纯绿），一旦在验证的时候背景变得复杂，则准确率会大大降低。
既然如此......那就来做个数据增广吧，把这些数据集里的手全都抠出来，然后贴到复杂场景里就行了。那把手抠出来......当然优先选择 Paddlehub

模型

当然我并没有使用ace2p这种更细粒度的模型，而是使用了deeplabv3p_xception65_humanseg，不因为别的，只是因为我顺手......这个模型用得很熟练哈哈

用到的数据集

手势数据集：aistudio前排手势的数据基本上都用了，因为还有背景数据，用的比较多，一个项目好像只能索引两个数据集，所以我就不引入了，以防不公平，这里把链接贴出来。手势识别
手势
gesture
手势
手势_石头剪头布
背景数据集，我直接使用的我本地的图，只有上次从ADE2K里挑出来的segsky分割出的数据了。
segsky

Blogcast™

BlogcastTM是一个文本转语音的工具，允许用户创建播客、视频、电子学习课程的音频和音频书籍，而无需录制。

查看详情

任务

由于我的任务只需要检测到“5”的手势，所以这里是一个简单的2分类，区分“5”及其他
增广前的“5”
数据增广+手势识别[Paddlehub+PaddleX] - php中文网
增广后的“5”

增广前的“其他”

增广后的“其他”

一方面为手势增加了背景，另一方面让数据变得更多了
经过筛选，5的数据原本979张，增广后2988张

In [ ]

import paddlehub as hubimport cv2import numpy as npimport globimport osimport randomimport argparseclass segUtils():
    def __init__(self):
        super().__init__()
        self.module = hub.Module(name="deeplabv3p_xception65_humanseg")    def doseg(self, frame):
        res = self.module.segmentation(images=[frame], use_gpu=True)        return res[0]['data']def randomCrop(frame, h, w):
    bh, bw = frame.shape[:2]    if bw - w > 0 and bh - h > 0:
        randx = random.randint(0, bw - w)
        randy = random.randint(0, bh - h)        return frame[randy:randy + h,randx:randx + w]    else:        return cv2.resize(frame, (w, h))def main(args):

    backlist = glob.glob(os.path.join(args.backdir, "*.jpg"))
    handlist = glob.glob(os.path.join(args.handdir, "*.png")) + glob.glob(os.path.join(args.handdir, "*.jpg"))    print("back image: ", len(backlist))    print("hand image: ", len(handlist))
    save_dir = args.savedir    if not os.path.exists(save_dir):
        os.makedirs(save_dir)
        SU = segUtils()        for handpath in handlist:
            img = cv2.imread(handpath)
            basename = os.path.basename(handpath)
            filename, ext = os.path.splitext(basename)
            mask = SU.doseg(img)
            mask[mask <= 1] = 0
            mask[mask > 1] = 1
            
            mask = np.repeat(mask[:,:,np.newaxis], 3, axis=2)
            h,w = img.shape[:2]            for i in range(2):
                rback = cv2.imread(backlist[random.randint(0, len(backlist)-1)])
                crop = randomCrop(rback, h, w)
                res = mask * img + (1 - mask) * crop
                newname = filename + str(i) + ext
                cv2.imwrite(os.path.join(save_dir,newname), res.astype(np.uint8))if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument("--backdir", type=str, required=True)
    parser.add_argument("--handdir", type=str, required=True)
    parser.add_argument("--savedir", type=str, required=True)
    args = parser.parse_args()
    main(args)

登录后复制

训练

至于训练，当然是直接paddleX啦，直接用GUI版本的快速验证自己的想法啦，快速的选择分类模型，开始吧~ 选择的MobileNetV3_small_ssld这个模型，batchsize32，训练了30个epoch，太过简单，就不写流程了。数据增广+手势识别[Paddlehub+PaddleX] - php中文网

测试

一些测试结果图，效果完全OK哈哈哈
数据增广+手势识别[Paddlehub+PaddleX] - php中文网
本地开着摄像头视频做了一些测试，效果还不错，但是忘了保存视频了，之后补上。

In [ ]

# 验证 上传一张test.jpg的图片进行测试吧!python predict.py

登录后复制

以上就是数据增广+手势识别[Paddlehub+PaddleX]的详细内容，更多请关注php中文网其它相关文章！

大家都在看：

使用spaCy和Python进行文本分类：自然语言处理教程如何用AI快速制作GIF动图 AI视频转GIF一键生成工具【教程】如何用AI自动写Excel复杂公式 AI表格数据分析助手使用技巧【教程】利用Docling和Python构建开源AI知识库（含教程） OpenCV图像平移教程：使用Python进行图像转换