如题。我看这个systolic array融合了S = QK 以及 O = PV这两个矩阵乘,前者是Br x d和d x Bc的矩阵乘,后者是Br x Bc和Bc x d的矩阵乘,也就是说需要要求Br, Bc, d这三个数都一样才能完整的复用systolic array。