首页 1 2 3 4 5 6 7

2.pytorch--混合精度训练

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言

提示：这里可以添加本文要记录的大概内容：

例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。

提示：以下是本篇文章正文内容，下面案例可供参考

一、混合精度训练

原理：

将FP32的数据存储成FP16显然可以减小存储空间也可加快运算速度。但对于 FP16 不可避免的问题就是：表示的范围较窄，如下图所示，大量非 0 梯度会遇到溢出问题。

解决办法是：

对梯度乘一个 [公式] 的系数，称为 scale factor，把梯度 shift 到 FP16 的表示范围。而这一切，自动混合精度训练都给我们安排好了。

步骤：

GradScaler的工作就是在反向传播前给 loss 乘一个 scale factor，所以之后反向传播得到的梯度都乘了相同的 scale factor。并且为了不影响学习率，在梯度更新前将梯度unscale。总结amp的基本训练流程：

维护一个 FP32 数值精度模型的副本
在每个iteration
1.拷贝并且转换成 FP16 模型
2.前向传播（FP16 的模型参数）
3.loss 乘 scale factor s
4.反向传播（FP16 的模型参数和参数梯度）
5.参数梯度乘 1/s
6.利用 FP16 的梯度更新 FP32 的模型参数

二、使用步骤

1.引入库

代码如下（示例）：

import torch

2.使用混合精度训练

代码如下（示例）：

# amp依赖Tensor core架构，所以model参数必须是cuda tensor类型
model = Net().cuda()
optimizer = optim.SGD(model.parameters(), ...)
# GradScaler对象用来自动做梯度缩放
scaler = GradScaler()

for epoch in epochs:
    for input, target in data:
        optimizer.zero_grad()
        # 在autocast enable 区域运行forward
        with autocast():
            # model做一个FP16的副本，forward
            output = model(input)
            loss = loss_fn(output, target)
        # 用scaler，scale loss(FP16)，backward得到scaled的梯度(FP16)
        scaler.scale(loss).backward()
        # scaler 更新参数，会先自动unscale梯度
        # 如果有nan或inf，自动跳过
        scaler.step(optimizer)
        # scaler factor更新
        scaler.update()

总结

本文仅仅简单介绍了混合精度训练的使用，混合精度训练能够在现有硬件的情况下，为我们节省内存并提升模型的运算速度。

微信小程序，封装同步请求

封装统一请求的目的：在请求时有时会返回不同的返回码进行不同的数据处理，比如：返回正常时，进行正常操作，如果返回了异常，那么就需要进行不同的处理了，由于每次请求都可能出现各种返回码，所以进行请

webpack配置

# Vue.js -- Webpack ## 网页中引入的静态资源多了以后有什么问题？？？

SQLserver数据库原理（数据库系统概述）

数据库系统概述目录一、数据库技术发展史数据处理技术数据库技术的3个发展阶段

vue 按钮实现复制内容之Clipboard

安装插件：npm install clipboard --save 引入：import Clipboard from 'clipboard' 我是封装到一个公共的js里面,代码如下：

基于 KubeVela 与 Kubernetes 打造“无限能力”的开放 PaaS

从RNN到GRU和LSTM

文章目录前言

对抗样本库之cleverhans

【数据库原理 • 一】数据库系统概念

前言数据库技术是计算机科学技术中发展最快，应用最广的技术之一，它是专门研究如何科学的组织和存储数据，如何高效地获取和处理数据的技术。它已成为各行各业存储数据、管理信息、共享资源和决策支持的最先进，最常用的技术。

MATLAB代码：计及电转气协同的含碳捕集与垃圾焚烧虚拟电厂优化调度

MATLAB代码：计及电转气协同的含碳捕集与垃圾焚烧虚拟电厂优化调度关键词：碳捕集虚拟电厂需求响应优化调度电转气协同调度参考文档：《计及电转气协同的含碳捕集与垃圾焚烧虚拟电厂优化调度》复现程序仿真平台：MATLAB+CPLEX 使用的是y

sql语法汇总

日期格式自动转化为时间戳 SELECT txNo, year_month_date, UNIX_TIMESTAMP(year_month_date) * 1000 AS "Milliseconds