SlimGAIN（SGAIN）代码实现.zip

共2个文件

csv：1个

py：1个

版权申诉

神经网络

深度学习

pytorch

python

5星 · 超过95%的资源 45 浏览量 2022-06-27 20:45:10 上传评论 1 收藏 195KB ZIP 举报

《Slim GAIN（SGAIN）在PyTorch中的实现与深度学习解析》 Slim GAIN (SGAIN) 是一种优化神经网络模型结构的算法，它旨在通过精细化的权重分配来提高模型性能，同时减少计算资源的消耗。在深度学习领域，模型的复杂性和效率一直是研究的热点问题，而SGAIN提供了一种有效的解决方案。本文将详细介绍SGAIN的实现原理，并通过其在PyTorch中的代码实例进行深入探讨。理解SGAIN的关键在于它的核心思想——权重精细化。SGAIN通过引入一种自适应的增益因子来调整模型中各个通道的权重，使得那些对模型性能贡献更大的通道得到更多的关注和资源。这一方法可以看作是对现有模型结构的一种优化，它能够在不显著增加模型复杂性的情况下提升模型的准确率。在提供的代码文件"SGAIN.py"中，我们可以看到SGAIN的实现过程。SGAIN需要一个预训练的模型作为基础，通常是一个已经过充分训练且表现良好的深度学习模型。接着，算法会计算每个通道的重要性，这通常基于模型的梯度信息或激活值。在PyTorch中，这可以通过反向传播和前向传播过程来实现。代码中可能会包含如下的关键步骤： 1. 计算每个卷积层的输出特征图的平均绝对值，以估计通道的重要性。 2. 使用计算出的重要性值，对每个卷积层的权重进行重新调整，即应用增益因子。 3. 在新的权重上进行微调，以适应增益因子带来的变化。此外，"letter.csv"文件可能是用于训练或验证模型的数据集。它可能包含了多列数据，例如图像的特征表示和对应的类别标签。在使用SGAIN优化模型时，这个数据集将用于评估模型在优化后的性能。在深度学习领域，PyTorch是一个广泛使用的框架，它提供了灵活的张量运算和自动求导功能，使得SGAIN这样的算法实现变得相对简单。通过阅读和理解"SGAIN.py"的代码，开发者可以了解如何在实际项目中应用SGAIN，以优化自己的深度学习模型。总结来说，Slim GAIN（SGAIN）是一种优化深度学习模型结构的策略，它通过精细化的权重分配来提高模型性能。PyTorch为SGAIN的实现提供了强大的工具，使得开发者能够轻松地在自己的项目中应用这一技术。通过深入理解SGAIN的原理和代码实现，我们可以更有效地优化模型，实现更高的计算效率和准确率。

资源推荐

资源详情

资源评论

收起资源包目录

SGAIN.zip （2个子文件）

SGAIN.py 9KB

letter.csv 696KB

import numpy as np from tqdm import tqdm import torch import torch.nn.functional as F from sklearn.preprocessing import MinMaxScaler # 生成随机噪声 def sample_z(n_rows, m_cols, feature_range = (-0.01, +0.01)): return np.random.uniform(low=feature_range[0], high=feature_range[1], size=[n_rows, m_cols]) # (-0.01,0.01)随机采样 # Mask Vector def sample_M(m, n, p): ''' p:缺失率 A:(0,1)均匀分布的[m,n]矩阵 B:[m,n]布尔矩阵 C:[m,n]1 0矩阵(大约(1-p)%的1,p%的0) ''' A = np.random.uniform(0., 1., size=[m, n]) # 生成(0,1)分布随机采样 B = A > p C = 1. * B return C def sample_batch_index(total, batch_size): '''Sample index of the mini-batch. Args: - total: total number of samples - batch_size: batch size Returns: - batch_idx: batch index ''' total_idx = np.random.permutation(total) # 对序列total随机排序 batch_idx = total_idx[:batch_size] #获取前batch_size个值的数组 return batch_idx # Xavier Initialization Definition def xavier_init(size): in_dim = size[0] xavier_stddev = 1. / np.sqrt(in_dim / 2.) return np.random.normal(size = size, scale = xavier_stddev) def rounding(imputed_data, data_x): '''对于类别变量,对填补数据进行四舍五入 Args: - imputed_data: imputed data - data_x: original data with missing values Returns: - rounded_data: rounded imputed data ''' _, dim = data_x.shape rounded_data = imputed_data.copy() for i in range(dim): temp = data_x[~np.isnan(data_x[:, i]), i] # Only for the categorical variable if len(np.unique(temp)) < 20: rounded_data[:, i] = np.round(rounded_data[:, i]) return rounded_data def rmse_loss(ori_data, imputed_data, data_m): '''计算ori_data和imputed_data的RMSE loss Args: - ori_data: original data without missing values - imputed_data: imputed data - data_m: indicator matrix for missingness Returns: - rmse: Root Mean Squared Error ''' ori_data=scaler.fit_transform(ori_data) imputed_data=scaler.fit_transform(imputed_data) # Only for missing values nominator = np.sum(((1 - data_m) * ori_data - (1 - data_m) * imputed_data) ** 2) denominator = np.sum(1 - data_m) rmse = np.sqrt(nominator / float(denominator)) return rmse def SGAIN(data): ## GAIN architecture # Discriminator variables if use_gpu is True: D_W1 = torch.tensor(xavier_init([m_dim, m_dim]), requires_grad=True, device="cuda") # Data + Hint as inputs D_b1 = torch.tensor(np.zeros(shape=[m_dim]), requires_grad=True, device="cuda") D_W2 = torch.tensor(xavier_init([m_dim, m_dim]), requires_grad=True, device="cuda") D_b2 = torch.tensor(np.zeros(shape=[m_dim]), requires_grad=True, device="cuda") # Output is multi-variate else: D_W1 = torch.tensor(xavier_init([m_dim, m_dim]), requires_grad=True) # Data + Hint as inputs D_b1 = torch.tensor(np.zeros(shape=[m_dim]), requires_grad=True) D_W2 = torch.tensor(xavier_init([m_dim, m_dim]), requires_grad=True) D_b2 = torch.tensor(np.zeros(shape=[m_dim]), requires_grad=True) # Output is multi-variate theta_D = [D_W1, D_W2, D_b1, D_b2] # %% 2. Generator if use_gpu is True: G_W1 = torch.tensor(xavier_init([m_dim * 2, m_dim]), requires_grad=True,device="cuda") # Data + Mask as inputs (Random Noises are in Missing Components) G_b1 = torch.tensor(np.zeros(shape=[m_dim]), requires_grad=True, device="cuda") G_W2 = torch.tensor(xavier_init([m_dim, m_dim]), requires_grad=True, device="cuda") G_b2 = torch.tensor(np.zeros(shape=[m_dim]), requires_grad=True, device="cuda") else: G_W1 = torch.tensor(xavier_init([m_dim * 2, m_dim]), requires_grad=True) # Data + Mask as inputs (Random Noises are in Missing Components) G_b1 = torch.tensor(np.zeros(shape=[m_dim]), requires_grad=True) G_W2 = torch.tensor(xavier_init([m_dim, m_dim]), requires_grad=True) G_b2 = torch.tensor(np.zeros(shape=[m_dim]), requires_grad=True) theta_G = [G_W1, G_W2, G_b1, G_b2] ## GAIN functions # Generator def generator(z, m): # Concatenate Data and Mask inputs = torch.cat(dim=1, tensors=[z, m]) G_h1 = F.relu(torch.matmul(inputs, G_W1) + G_b1) G_prob = torch.tanh(torch.matmul(G_h1, G_W2) + G_b2) return G_prob # Discriminator def discriminator(x): # Concatenate Data and Hint inputs = x D_h1 = F.relu(torch.matmul(inputs, D_W1) + D_b1) D_prob = torch.tanh(torch.matmul(D_h1, D_W2) + D_b2) return D_prob # GAIN Loss def discriminator_loss(X, M, Z): # Generator G_sample = generator(Z, M) # Discriminator D_real = discriminator(X) D_fake = discriminator(G_sample) # %% Loss D_loss = torch.mean(M * D_real) - torch.mean((1 - M) * D_fake) return D_loss def generator_loss(X, M, Z): # %% Structure # Generator G_sample = generator(Z, M) # Discriminator # D_real = discriminator(X) D_fake = discriminator(G_sample) # %% Loss G_loss1 = -torch.mean((1 - M) * D_fake) MSE_loss = torch.mean((M * X - M * G_sample) ** 2) / torch.mean(M) G_loss = G_loss1 + alpha * MSE_loss return G_loss, MSE_loss data=data.copy() # 数据归一化 data_miss = scaler.fit_transform(data) data_mask = 1. - np.isnan(data) # 定义Mask矩阵(缺失数据为0,非缺失数据为1) data_miss = np.nan_to_num(data_miss, nan=0.00) # optimizer optimizer_D = torch.optim.Adam(params=theta_D,lr=lr,betas=(beta_1,beta_2),eps=epsilon) optimizer_G = torch.optim.Adam(params=theta_G,lr=lr,betas=(beta_1,beta_2),eps=epsilon) # Start Iterations for it in tqdm(range(n_iterations+1)): # Sample batch batch_idx = sample_batch_index(total=no, batch_size=batch_size) X_mb=data_miss[batch_idx, :] # 获取第batch_idx行的X元素(128,16) M_mb = data_mask[batch_idx, :] # 获取第batch_idx行的M元素(128,16) Z_mb = M_mb * X_mb + (1 - M_mb) * sample_z(batch_size,m_dim) if use_gpu is True: X_mb = torch.tensor(X_mb, device="cuda") M_mb = torch.tensor(M_mb, device="cuda") Z_mb = torch.tensor(Z_mb, device="cuda") else: X_mb = torch.tensor(X_mb) M_mb = torch.tensor(M_mb) Z_mb = torch.tensor(Z_mb) optimizer_D.zero_grad() D_loss_curr = discriminator_loss(X=M_mb, M=X_mb,Z=Z_mb) D_loss_curr.backward() optimizer_D.step() optimizer_G.zero_grad() G_loss_curr, MSE_loss_curr = generator_loss(X=X_mb, M=M_mb, Z=Z_mb) G_loss_curr.backward() optimizer_G.step() if it % 1000 == 0: tqdm.write(f"Iteration: {it}; " f"MSE_loss: {MSE_loss_curr:.4}") # tqdm.write(f"Iteration: {it}; " # f"D loss: {D_loss_curr:.4}; G_loss: {G_loss_curr:.4}; MSE_loss: {MSE_loss_curr:.4}") # impute data Z_all = data_mask*data_miss + (1 - data_mask)*sample_z(no,m_dim) # 转为tensor if use_gpu is True: Z_all = torch.tensor(Z_all, device='cuda') data_mask = torch.tensor(data_mask, device='cuda') else: Z_all = torch.tensor(Z_all) data_mask = torch.tensor(data_mask) imputed_data = generator(z=Z_all, m=data_mask) if use_gpu is True: imputed_data = imputed_data.cpu().detach().numpy()

评论收藏

内容反馈

版权申诉