HAR-Dataset-Preprocess/models/resnest.py at main · xushige/HAR-Dataset-Preprocess · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
import torch.nn as nn
import torch

'''ResNeSt: 结合 ResNext 与 SkNet 思想, 建议先看懂 ResNext 与 SKResNet'''
class ResNextBlock(nn.Module):
    def __init__(self, inchannel, outchannel, kernel_size, stride, groups):
        super().__init__()
        if inchannel != 1:
            assert inchannel % groups == 0 # inchannel必须整除groups
            group_channel = inchannel // groups
        else:
            group_channel = outchannel
        layer_lists = []
        for i in range(groups):
            layer_lists.append(nn.Sequential(
                nn.Conv2d(inchannel, group_channel, (kernel_size, 1), (stride, 1), (kernel_size//2, 0)),
                nn.BatchNorm2d(group_channel),
                nn.ReLU(),
                nn.Conv2d(group_channel, outchannel, 1, 1, 0),
                nn.BatchNorm2d(outchannel)
            ))

        self.group_layer_lists = nn.ModuleList(layer_lists)
        self.relu = nn.ReLU()

    def forward(self, x):
        '''
            x.shape: [b, c, series, modal]
        '''
        out = torch.cat([group_layer(x).unsqueeze(0) for group_layer in self.group_layer_lists], dim=0)
        out = self.relu(torch.sum(out, dim=0))
        return out

class SKBlock(nn.Module):
    def __init__(self, inchannel, outchannel, stride, groups):
        super().__init__()
        # SK 选择核思想 这里默认选了(3,1), (5,1), (7,1), (9,1) 四种并行尺度进行选择
        self.kernel1 = ResNextBlock(inchannel=inchannel, outchannel=outchannel, kernel_size=3, stride=stride, groups=groups) # 每一个尺度不是单纯的Conv2D, 采用了ResNext的分组卷积思想
        self.kernel2 = ResNextBlock(inchannel=inchannel, outchannel=outchannel, kernel_size=5, stride=stride, groups=groups)
        self.kernel3 = ResNextBlock(inchannel=inchannel, outchannel=outchannel, kernel_size=7, stride=stride, groups=groups)
        self.kernel4 = ResNextBlock(inchannel=inchannel, outchannel=outchannel, kernel_size=9, stride=stride, groups=groups)
        self.gap = nn.AdaptiveAvgPool2d(1)
        self.att_fc = nn.Sequential(
            nn.Linear(outchannel, outchannel*4),
            nn.Sigmoid()
        )

    def forward(self, x):
        '''
            x.shape: [b, c, series, modal]
        '''
        y1 = self.kernel1(x).unsqueeze(1) # [b, 1, outchannel, h, modal]
        y2 = self.kernel2(x).unsqueeze(1)
        y3 = self.kernel3(x).unsqueeze(1)
        y4 = self.kernel4(x).unsqueeze(1)
        y_total = torch.cat([y1, y2, y3, y4], dim=1) # [b, 4, outchannel, h, modal]

        attn = self.att_fc(self.gap(torch.sum(y_total, dim=1)).squeeze(-1).squeeze(-1)) # [b, outchanel * 4]
        attn = attn.reshape(x.size(0), 4, -1).unsqueeze(-1).unsqueeze(-1) # [b, 4, outchanel, 1, 1]

        attn_y = y_total * attn #[b, 4, outchannel, h, modal] * [b, 4, outchanel, 1, 1] = [b, 4, outchannel, h, modal]
        out = torch.sum(attn_y, dim=1) # [b, outchannel, h, modal]
        return out

class Block(nn.Module):
    def __init__(self, inchannel, outchannel, stride, groups):
        super().__init__()
        self.block = SKBlock(inchannel=inchannel, outchannel=outchannel, stride=stride, groups=groups)
        self.short = nn.Sequential()
        if (inchannel != outchannel or stride != 1):
            self.short = nn.Sequential(
                nn.Conv2d(inchannel, outchannel, (3, 1), (stride, 1), (1, 0)),
                nn.BatchNorm2d(outchannel)
            )

    def forward(self, x):
        '''
            x.shape: [b, c, series, modal]
        '''
        out = self.block(x) + self.short(x)
        return nn.ReLU()(out)

class ResNeSt(nn.Module):
    def __init__(self, train_shape, category, groups=2):
        super().__init__()
        '''
            train_shape: 总体训练样本的shape
            category: 类别数
            groups: 每个ResNextBlock里有多少并行组
        '''
        self.groups = groups
        self.layer1 = self.make_layers(1, 64, 2, 1)
        self.layer2 = self.make_layers(64, 128, 2, 1)
        self.layer3 = self.make_layers(128, 256, 2, 1)
        self.layer4 = self.make_layers(256, 512, 2, 1)
        self.ada_pool = nn.AdaptiveAvgPool2d((1, train_shape[-1]))
        self.fc = nn.Linear(512*train_shape[-1], category)

    def forward(self, x):
        '''
            x.shape: [b, c, series, modal]
        '''
        x = self.layer1(x)
        x = self.layer2(x)
        x = self.layer3(x)
        x = self.layer4(x)
        x = self.ada_pool(x)
        x = x.view(x.size(0), -1)
        x = self.fc(x)
        return x

    def make_layers(self, inchannel, outchannel, stride, blocks):
        layer = [Block(inchannel, outchannel, stride, self.groups)]
        for i in range(1, blocks):
            layer.append(Block(outchannel, outchannel, 1, self.groups))
        return nn.Sequential(*layer)