【482】Keras 实现 LSTM & BiLSTM

2025-01-15

参考：Keras 真现 LSTM

参考：Keras-递归层Recurrent官方注明

参考：GitHub - Keras LSTM

参考：GitHub - Keras BiLSTM

　　LSTM 是良好的循环神经网络 (RNN) 构造，而 LSTM 正在构造上也比较复纯，对 RNN 和 LSTM 还稍有疑问的冤家可以参考：Recurrent Neural Networks ZZZs LSTM【参考李宏毅教师的讲课PPT内容】

　　那里咱们将要运用 Keras 搭建 LSTM.Keras 封拆了一些良好的深度进修框架的底层真现，运用起来相当简约，以至不须要深度进修的真践知识，你都可以轻松快捷的搭建你的深度进修网络，强烈引荐给刚入门深度进修的同学运用，虽然我也是还没入门的这个。Keras：hts://keras.io/，keras的backend有，theano，TensorFlow、CNTk，那里我运用的是 TensorFlow。

　　下面咱们就初步搭建 LSTM & BiLSTM，真现 mnist 数据的分类。

一、加载包和界说参数

　　mnist 的 image 是 28*28 的 shape，咱们界说 LSTM 的 input 为 (28,)，将 image 一止一止地输入到 LSTM 的 cell 中，那样 time_step 便是 28，默示一个 image 有 28 止，LSTM 的 output 是 30 个。

from tensorflow import keras import mnist from keras.layers import Dense, LSTM, Bidirectional from keras.utils import to_categorical from keras.models import Sequential # parameters for LSTM nb_lstm_outputs = 30 # 输入迷经元个数 nb_time_steps = 28 # 光阳序列的长度 nb_input_ZZZectors = 28 # 每个输入序列的向质维度

二、数据预办理

　　出格留心 label 要运用 one_hot encoding，V_train 的 shape 为 (60000, 28,28）

# data preprocessing V_train = mnist.train_images() y_train = mnist.train_labels() V_test = mnist.test_images() y_test = mnist.test_labels() # Nomalize the images V_train = (V_train / 255) - 0.5 V_test = (V_test / 255) - 0.5 # one_hot encoding y_train = to_categorical(y_train, num_classes=10) y_test = to_categorical(y_test, num_classes=10)

三、搭建模型 (LSTM, BiLSTM)

　　keras 搭建模型相当简略，只须要正在 Sequential 容器中不停 add 新的 layer 就可以了。

# building model model = Sequential() model.add(LSTM(units=nb_lstm_outputs, input_shape=(nb_time_steps, nb_input_ZZZectors))) model.add(Dense(10, actiZZZation='softmaV'))

　　BiLSTM 模型搭建如下：详细真现办法差别不大

# building model model = Sequential() model.add( Bidirectional( LSTM( units=nb_lstm_outputs, return_sequences=True ), input_shape=(nb_time_steps, nb_input_ZZZectors) ) ) model.add( Bidirectional( LSTM(units=nb_lstm_outputs) ) ) model.add( Dense( 10, actiZZZation='softmaV' ) )

四、compile

　　模型 compile，指定 loss function，optimizer，metrics

# compile:loss, optimizer, metrics modelsspile( loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'] )

五、summary

　　可以运用 model.summary() 来查察你的神经网络的架会谈参数质等信息。

model.summary() output: _________________________________________________________________ Layer (type) Output Shape Param # ================================================================= lstm_1 (LSTM) (None, 30) 7080 _________________________________________________________________ dense_1 (Dense) (None, 10) 310 ================================================================= Total params: 7,390 Trainable params: 7,390 Non-trainable params: 0 _________________________________________________________________

　　BiLSTM 结果如下：多了一层 layer

_________________________________________________________________ Layer (type) Output Shape Param # ================================================================= bidirectional_1 (Bidirection (None, 28, 60) 14160 _________________________________________________________________ bidirectional_2 (Bidirection (None, 60) 21840 _________________________________________________________________ dense_2 (Dense) (None, 10) 610 ================================================================= Total params: 36,610 Trainable params: 36,610 Non-trainable params: 0 _________________________________________________________________

六、train

　　模型训练，须要指定，epochs 训练的轮次数，batch_size。

model.fit( V_train, y_train, epochs=20, batch_size=128, ZZZerbose=1 ) output: Epoch 1/20 60000/60000 [==============================] - 11s 184us/step - loss: 0.9702 - acc: 0.6919 Epoch 2/20 60000/60000 [==============================] - 9s 152us/step - loss: 0.3681 - acc: 0.8921 Epoch 3/20 60000/60000 [==============================] - 9s 143us/step - loss: 0.2505 - acc: 0.9263 Epoch 4/20 60000/60000 [==============================] - 9s 147us/step - loss: 0.1985 - acc: 0.9411 Epoch 5/20 60000/60000 [==============================] - 9s 156us/step - loss: 0.1673 - acc: 0.9508 Epoch 6/20 60000/60000 [==============================] - 10s 163us/step - loss: 0.1473 - acc: 0.9563 Epoch 7/20 60000/60000 [==============================] - 10s 162us/step - loss: 0.1311 - acc: 0.9605 Epoch 8/20 60000/60000 [==============================] - 10s 162us/step - loss: 0.1176 - acc: 0.9650 Epoch 9/20 60000/60000 [==============================] - 10s 167us/step - loss: 0.1054 - acc: 0.9688 Epoch 10/20 60000/60000 [==============================] - 10s 165us/step - loss: 0.0991 - acc: 0.9702 Epoch 11/20 60000/60000 [==============================] - 10s 164us/step - loss: 0.0899 - acc: 0.9730 Epoch 12/20 60000/60000 [==============================] - 10s 169us/step - loss: 0.0857 - acc: 0.9741 Epoch 13/20 60000/60000 [==============================] - 10s 166us/step - loss: 0.0781 - acc: 0.9758 Epoch 14/20 60000/60000 [==============================] - 10s 167us/step - loss: 0.0740 - acc: 0.9776 Epoch 15/20 60000/60000 [==============================] - 10s 172us/step - loss: 0.0697 - acc: 0.9786 Epoch 16/20 60000/60000 [==============================] - 10s 171us/step - loss: 0.0678 - acc: 0.9795 Epoch 17/20 60000/60000 [==============================] - 10s 170us/step - loss: 0.0639 - acc: 0.9798 Epoch 18/20 60000/60000 [==============================] - 10s 169us/step - loss: 0.0589 - acc: 0.9817 Epoch 19/20 60000/60000 [==============================] - 10s 172us/step - loss: 0.0597 - acc: 0.9817 Epoch 20/20 60000/60000 [==============================] - 10s 168us/step - loss: 0.0558 - acc: 0.9825

　　BiLSTM 结果如下：结果更好

Epoch 1/20 60000/60000 [==============================] - 46s 767us/step - loss: 0.6845 - acc: 0.7782 Epoch 2/20 60000/60000 [==============================] - 48s 799us/step - loss: 0.1843 - acc: 0.9435 Epoch 3/20 60000/60000 [==============================] - 45s 751us/step - loss: 0.1241 - acc: 0.9627 Epoch 4/20 60000/60000 [==============================] - 45s 747us/step - loss: 0.0956 - acc: 0.9712 Epoch 5/20 60000/60000 [==============================] - 46s 766us/step - loss: 0.0806 - acc: 0.9754 Epoch 6/20 60000/60000 [==============================] - 46s 771us/step - loss: 0.0667 - acc: 0.9793 Epoch 7/20 60000/60000 [==============================] - 45s 754us/step - loss: 0.0584 - acc: 0.9820 Epoch 8/20 60000/60000 [==============================] - 44s 741us/step - loss: 0.0513 - acc: 0.9835 Epoch 9/20 60000/60000 [==============================] - 45s 742us/step - loss: 0.0445 - acc: 0.9863 Epoch 10/20 60000/60000 [==============================] - 46s 767us/step - loss: 0.0419 - acc: 0.9874 Epoch 11/20 60000/60000 [==============================] - 45s 755us/step - loss: 0.0378 - acc: 0.9885 Epoch 12/20 60000/60000 [==============================] - 46s 758us/step - loss: 0.0332 - acc: 0.9894 Epoch 13/20 60000/60000 [==============================] - 45s 750us/step - loss: 0.0318 - acc: 0.9894 Epoch 14/20 60000/60000 [==============================] - 45s 756us/step - loss: 0.0279 - acc: 0.9911 Epoch 15/20 60000/60000 [==============================] - 45s 745us/step - loss: 0.0262 - acc: 0.9917 Epoch 16/20 60000/60000 [==============================] - 45s 758us/step - loss: 0.0258 - acc: 0.9916 Epoch 17/20 60000/60000 [==============================] - 47s 791us/step - loss: 0.0226 - acc: 0.9923 Epoch 18/20 60000/60000 [==============================] - 47s 791us/step - loss: 0.0223 - acc: 0.9930 Epoch 19/20 60000/60000 [==============================] - 46s 773us/step - loss: 0.0179 - acc: 0.9943 Epoch 20/20 60000/60000 [==============================] - 45s 747us/step - loss: 0.0199 - acc: 0.9935

七、eZZZaluate

　　通过 model.eZZZaluate() 来真现。

score = model.eZZZaluate(V_test, y_test, batch_size=128, ZZZerbose=1) print(score) output: 10000/10000 [==============================] - 0s 49us/step [0.06827456439994276, 0.9802]

　　BiLSTM 结果：更好

10000/10000 [==============================] - 2s 250us/step [0.055307343754824254, 0.9838]

出售本站【域名】【外链】

【482】Keras 实现 LSTM & BiLSTM

猜你喜欢