Keras自定义数据集

Keras学习过程中，使用的数据集都是keras.datasets.mnist.load_data()，直接使用处理好的数据集，想要尝试使用自己搜集的图片，却又不知道如何加载。查找其他人自定义数据集的方式，做一个记录。

链接: https://pan.baidu.com/s/12ddpk2eKDCAu7Z1UTZWtEA 提取码: gxqj

文件夹结构：

images
- hua（包含花的图片文件夹）
- niao
- yu
- chong
- imgcsv.csv
my_load_data.py
train.py

思路：

列出images下文件夹（images/花;images/鸟等）
将images/花等文件夹下所有图片路径，标签写入imgcsv.csv，方便下次读取
读取csv文件，通过图片路径读取图片，转换为数组格式

my_load_data.py

import os, glob, csv, random
import tensorflow as tf


def load_csv(root, csvname, name2label):
    '''
    root:images文件夹路径
    csvname：写入的csv文件名
    name2label：字典,key为类别名，value为对于标签
    '''
    # 如果不存在csv文件，则创建写入
    if not os.path.exists(os.path.join(root, csvname)):
        images = []
        for name in name2label.keys():
            # 返回图片路径：images/hua/***
            images += glob.glob(os.path.join(root, name, "*.*g"))
        # 图片按类别写入列表，需要打乱顺序
        random.shuffle(images)
        # 将路径,标签信息写入csv文件
        with open(os.path.join(root, csvname), 'w', newline="") as f:
            writer = csv.writer(f)
            for img in images:
                # 将路径按/或\分离[images,hua,**.jpg]取出类别名
                name = img.split(os.sep)[-2]
                # 根据字典key，对应value找出对应标签
                label = name2label[name]
                writer.writerow([img, label])
    # 已经存在csv文件，直接读取
    else:
        images, labels = [], []
        with open(os.path.join(root, csvname)) as f:
            reader = csv.reader(f)
            for row in reader:
                img, label = row
                label = int(label)
                images.append(img)
                labels.append(label)
        assert len(images) == len(labels)
        return images, labels


def load_data(root, mode='train'):
    name2label = {}
    # 列出images下文件夹
    for name in sorted(os.listdir(os.path.join(root))):
        # 如果images/***不是文件夹，跳过
        if not os.path.isdir(os.path.join(root, name)):
            continue
        else:
            name2label[name] = len(name2label.keys())
    images, labels = load_csv(root, "images.csv", name2label)
    if mode == 'train':  # 60%
        images = images[:int(0.6 * len(images))]
        labels = labels[:int(0.6 * len(labels))]
    elif mode == 'val':  # 20% = 60%->80%
        images = images[int(0.6 * len(images)):int(0.8 * len(images))]
        labels = labels[int(0.6 * len(labels)):int(0.8 * len(labels))]
    else:  # 20% = 80%->100%
        images = images[int(0.8 * len(images)):]
        labels = labels[int(0.8 * len(labels)):]

    return images, labels, name2label


def preprocess(x, y):
    x = tf.io.read_file(x)
    x = tf.image.decode_jpeg(x, channels=3)
    x = tf.image.resize(x, [244, 244])
    x = tf.cast(x, dtype=tf.float32) / 255.0
    y = tf.convert_to_tensor(y)
    y = tf.one_hot(y, depth=5)
    return x, y

train.py

import  os
import  tensorflow as tf
import  numpy as np
from    tensorflow import keras
from    tensorflow.keras import layers,optimizers,losses
from    tensorflow.keras.callbacks import EarlyStopping
from my_load_data import load_data,preprocess

batchsz = 32
# 创建训练集Datset对象
images, labels, table = load_data('flower_photos',mode='train')
db_train = tf.data.Dataset.from_tensor_slices((images, labels))
db_train = db_train.shuffle(1000).map(preprocess).batch(batchsz)
# 创建验证集Datset对象
images2, labels2, table = load_data('flower_photos',mode='val')
db_val = tf.data.Dataset.from_tensor_slices((images2, labels2))
db_val = db_val.map(preprocess).batch(batchsz)
# 创建测试集Datset对象
images3, labels3, table = load_data('flower_photos',mode='test')
db_test = tf.data.Dataset.from_tensor_slices((images3, labels3))
db_test = db_test.map(preprocess).batch(batchsz)

#创建网络模型
net = keras.applications.VGG16(weights='imagenet',include_top=False,pooling='max')
net.trainable = False
newnet = keras.Sequential([
    net,
    layers.Dense(128),
    layers.Dense(64),
    layers.Dense(5)
])
newnet.build(input_shape=(4, 224, 224, 3))
newnet.summary()

early_stopping = EarlyStopping(
    monitor='val_accuracy',
    min_delta=0.001,
    patience=5
)

newnet.compile(optimizer=optimizers.Adam(lr=1e-3),
               loss=losses.CategoricalCrossentropy(from_logits=True),
               metrics=['accuracy'])
newnet.fit(db_train, validation_data=db_val, validation_freq=1, epochs=100,
           callbacks=[early_stopping])
newnet.evaluate(db_test)

使用Asp.Net MVC开发真正的Web程序

现在Asp.net MVC1.0已经正式发了,完全改变我们在.Net平台下开发Web程序的方式.不在像以前的Web form采用事件的方式来控制所有操作.我是从2003年,从Delphi转到asp.net平台上的,一开始就使用Web form开发网站,真是爽,和使用delphi开发C

portrait表示纵向，landscape表示横向

portrait表示纵向，landscape表示横向如果要使Activity的View界面全屏，只需要将最上面的信号栏和Activity的Title栏隐藏掉即可，隐藏Title栏的代码：

Linux下对PC/SC智能卡接口编程

PC/SC（Personal Computer/Smart Card）规范，PC/SC 规范作为读卡器和卡与计算机之间有一个标准接口，实现不同生产商的卡和读卡器之间的交互操作 Linux下运行的源码pcsc-lite 在

自动驾驶仿真程序 c++实现可以自己制作道路轮廓线并导出使用

自动驾驶仿真程序 c++实现可以自己制作道路轮廓线并导出使用可以加载odr格式的单条道路轮廓作为参考线可以保持车道可以实现变道 qt界面可视化id=631587108004&am

Android开发中需要和HTML5交互的各自方法以及示例

在 Android 开发中，我们通常使用 WebView 组件来加载和显示 HTML5 页面。要实现 Android 与 HTML5 的交互，我们需要使用 WebView 提供的 JavaScript 接口。以下是 Android 与 HTML5 交互的常用方法及示例：

无涯教程: Laravel 8 - 模型观察者

在这里，我将向您展示laravel 8观察者示例。该示例将帮助您如何使用laravel 8模型观察器。 Laravel观察者用于对模型事件监听器进行分组。 Laravel Observers将侦听模型方法(例如创建，更新和删除)的事件。Eloquent h

Flask开发系列之初体验

Flask开发初探介绍在日常开发中，如果需要开发一个小型应用或者Web

电商订单未支付-回仓（RabbitMQ实现）

大致流程：在订单下单时，触发RabitMQ的死信队列（死信队列中声明延时

手摸手部署IPFS(星际文件系统)

前言部署完UniSwap之后, 也要看一看备受推崇的IPFS, UniSwap的前端项目uniswap-interface就是基于此部署的简介

python通过函数名调用_python通过函数名调用函数的几种场景

一、说明除了执行系统命令外，我们有时还需要动态地执行一些python代码，有经验的朋友就会知道可以使用内置函数eval实现这一需求，如eval("print(__file__)")，这还是比较简单的。但如果要动态执行一个函数，讲的资料就会少一点，这