PyTorch Lightning教程六：优化代码

有时候模型训练很慢，代码写得冗长之后，没法诶个检查到底那块出现了占用了时空间，本节通过利用Lightning的一些方法，检查分析是那块代码出现了问题，从而来进一步指导和优化代码

本节主要基于性能分析方法，通过捕获分析信息（例如函数花费的时间或使用了多少内存）帮助我们找到代码中的瓶颈。

找到训练时候的瓶颈

最基本的性能分析配置文件，包含训练中Callback、DataModules和LightningModule中的所有关键方法。可以通过如下方法引入

一旦执行.fit()方法，则可以看到如下类似结果

FIT Profiler Report
-----------------------------------------------------------------------------------------------
|  Action                                          |  Mean duration (s)     |  Total time (s) |
-----------------------------------------------------------------------------------------------
|  [LightningModule]BoringModel.prepare_data       |  10.0001               |  20.00          |
|  run_training_epoch                              |  6.1558                |  6.1558         |
|  run_training_batch                              |  0.0022506             |  0.015754       |
|  [LightningModule]BoringModel.optimizer_step     |  0.0017477             |  0.012234       |
|  [LightningModule]BoringModel.val_dataloader     |  0.00024388            |  0.00024388     |
|  on_train_batch_start                            |  0.00014637            |  0.0010246      |
|  [LightningModule]BoringModel.teardown           |  2.15e-06              |  2.15e-06       |
|  [LightningModule]BoringModel.on_train_start     |  1.644e-06             |  1.644e-06      |
|  [LightningModule]BoringModel.on_train_end       |  1.516e-06             |  1.516e-06      |
|  [LightningModule]BoringModel.on_fit_end         |  1.426e-06             |  1.426e-06      |
|  [LightningModule]BoringModel.setup              |  1.403e-06             |  1.403e-06      |
|  [LightningModule]BoringModel.on_fit_start       |  1.226e-06             |  1.226e-06      |
-----------------------------------------------------------------------------------------------

在这个打印出来的报告中，我们可以看到最慢的函数是prepare_data，现在我们可以弄清楚为什么数据准备会减慢训练速度。执行profiler="simple"，会包括:

on_train_epoch_start
on_train_epoch_end
on_train_batch_start
model_backward
on_after_backward
optimizer_step
on_train_batch_end
on_training_end
等等……

分析每个函数内的时间

要分析每个函数花费的时间，使用构建在Python的cProfiler之上的AdvancedProfiler，如下引用：

执行fit后，会出现如下结果

Profiler Report

Profile stats for: get_train_batch
        4869394 function calls (4863767 primitive calls) in 18.893 seconds
Ordered by: cumulative time
List reduced from 76 to 10 due to restriction <10>
ncalls  tottime  percall  cumtime  percall filename:lineno(function)
3752/1876    0.011    0.000   18.887    0.010 {built-in method builtins.next}
    1876     0.008    0.000   18.877    0.010 dataloader.py:344(__next__)
    1876     0.074    0.000   18.869    0.010 dataloader.py:383(_next_data)
    1875     0.012    0.000   18.721    0.010 fetch.py:42(fetch)
    1875     0.084    0.000   18.290    0.010 fetch.py:44(<listcomp>)
    60000    1.759    0.000   18.206    0.000 mnist.py:80(__getitem__)
    60000    0.267    0.000   13.022    0.000 transforms.py:68(__call__)
    60000    0.182    0.000    7.020    0.000 transforms.py:93(__call__)
    60000    1.651    0.000    6.839    0.000 functional.py:42(to_tensor)
    60000    0.260    0.000    5.734    0.000 transforms.py:167(__call__)

如果分析器报告变得太长，可以将报告流式传输到一个文件：

from lightning.pytorch.profilers import AdvancedProfiler

profiler = AdvancedProfiler(dirpath=".", filename="perf_logs")
trainer = Trainer(profiler=profiler)

很方便！

分析加速器使用情况

另一种检测瓶颈的有用技术，是确保正在使用加速器(GPU/TPU/IPU/HPU)的全部容量。这可以用DeviceStatsMonitor来测量:

from lightning.pytorch.callbacks import DeviceStatsMonitor

trainer = Trainer(callbacks=[DeviceStatsMonitor()])

CPU指标将在CPU加速器上默认跟踪。设置DeviceStatsMonitor(cpu_stats=True)为其他加速器启用它。要禁用记录CPU指标，可以指定DeviceStatsMonitor(cpu_stats=False)。

已解决：使用conda install 安装报错

使用conda install 安装报错 Collecting package metadata (current_repoda

jquery的Theme和Theme Switcher使用总结

首先上一幅截图，效果不错吧^^欢迎光临我的[url]http://mee-moo.appspot.com[/url](别告诉我你不会fanqiang-,-) [img]http://dl.iteye.com/upload/attachment/154901/78d9fff8-e4ed-3

Date对象与字符串对象之间的相互转化

public static void main(String[] args) { //将Date对象转换为指定模式的字符串对象 Date date = new Date(); System.out.println(date); SimpleDateFormat sdf

1. 数据仓库&维度建模简介

数据仓库的设计目的　　软件产品来源于用户的需求，因此，在深入数据仓库的设计之前，我们需要了解客户的痛点有哪些，整理如下：我们收集了海量的数据，但无法对其访问；

计算机义务维护的相关知识,电脑义务维修的策划书

电脑义务维修的策划书一、活动主题：

【微服务技术一】Eureka、Nacos、Ribbon（配置管理、注册中心、负载均衡）

微服务技术一技术栈图

java设计模式——创建者模式——建造者模式

创建者模式——建造者模式建造者模式概述：在建造者模式中，一个复杂的对象被分解成若干的部件。部件由具体建造者类（builder）负责构造，有指挥类（director）负责装配。进而构造出复杂的对象。

前端学习笔记：JavaScript基础语法（ECMAScript）

此博客参考b站：【黑马程序员前端JavaScript入门到精通全套视频教程，javascript核心进阶ES6语法、API、js高级等基础知识和实战教程】https://www.bilibili.com/video/BV1Y84y1L7Nn?p=76&vd_source=06e554

【Express.js】集成SocketIO

集成SocketIO 本节我们介绍在如何在 express 中集成 Socket.IO Socket.IO 算是 WebSocket 的一个超集，进行了一些封装和拓展。准备工作

跨站请求伪造(CSRF)、主机头攻击、非GET/POST方法预防，一篇就够！

当前在处理系统安全测试缺陷问题时，发现诸多安全问题，记录解决过程和方法，分享共勉。解释： CSRF不懂看我历史文章：