0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

以深度學(xué)習(xí)為首的人工神經(jīng)網(wǎng)絡(luò)詳解

lviY_AI_shequ ? 2017-12-11 13:52 ? 次閱讀

神經(jīng)網(wǎng)絡(luò)是從生物領(lǐng)域自然的鬼斧神工中學(xué)習(xí)智慧的一種應(yīng)用。人工神經(jīng)網(wǎng)絡(luò)(ANN)的發(fā)展經(jīng)歷的了幾次高潮低谷,如今,隨著數(shù)據(jù)爆發(fā)、硬件計(jì)算能力暴增、深度學(xué)習(xí)算法的優(yōu)化,我們迎來(lái)了又一次的ANN雄起時(shí)代,以深度學(xué)習(xí)為首的人工神經(jīng)網(wǎng)絡(luò),又一次走入人們的視野。

感知機(jī)模型perceptron

不再處理離散情況,而是連續(xù)的數(shù)值,學(xué)習(xí)時(shí)權(quán)值在變化,從而記憶存儲(chǔ)學(xué)到的知識(shí)

神經(jīng)元輸入:類(lèi)似于線性回歸z =w1x1+w2x2 +? +wnxn= wT?x(linear threshold unit (LTU))

神經(jīng)元輸出:激活函數(shù),類(lèi)似于二值分類(lèi),模擬了生物學(xué)中神經(jīng)元只有激發(fā)和抑制兩種狀態(tài)。

增加偏值,輸出層哪個(gè)節(jié)點(diǎn)權(quán)重大,輸出哪一個(gè)。

采用Hebb準(zhǔn)則,下一個(gè)權(quán)重調(diào)整方法參考當(dāng)前權(quán)重和訓(xùn)練效果

#一個(gè)感知機(jī)的例子importnumpyasnpfromsklearn.datasetsimportload_irisfromsklearn.linear_modelimportPerceptroniris = load_iris()X = iris.data[:, (2,3)]# petal length, petal widthy = (iris.target ==0).astype(np.int)# Iris Setosa?per_clf = Perceptron(random_state=42)per_clf.fit(X, y)y_pred = per_clf.predict([[2,0.5]]

之后有人提出,perceptron無(wú)法處理異或問(wèn)題,但是,使用多層感知機(jī)(MLP)可以處理這個(gè)問(wèn)題

defheaviside(z): return(z >=0).astype(z.dtype)defsigmoid(z): return1/(1+np.exp(-z))#做了多層activation,手工配置權(quán)重defmlp_xor(x1, x2, activation=heaviside): returnactivation(-activation(x1 + x2 -1.5) + activation(x1 + x2 -0.5) -0.5)

如圖所示,兩層MLP,包含輸入層,隱層,輸出層。所謂的深度神經(jīng)網(wǎng)絡(luò),就是隱層數(shù)量多一些。

激活函數(shù)

以下是幾個(gè)激活函數(shù)的例子,其微分如右圖所示

step是最早提出的一種激活函數(shù),但是它在除0外所有點(diǎn)的微分都是0,沒(méi)有辦法計(jì)算梯度

logit和雙曲正切函數(shù)tanh梯度消失,數(shù)據(jù)量很大時(shí),梯度無(wú)限趨近于0,

relu在層次很深時(shí)梯度也不為0,無(wú)限傳導(dǎo)下去。

如何自動(dòng)化學(xué)習(xí)計(jì)算權(quán)重(backpropagation)

首先正向做一個(gè)計(jì)算,根據(jù)當(dāng)前輸出做一個(gè)error計(jì)算,作為指導(dǎo)信號(hào)反向調(diào)整前一層輸出權(quán)重使其落入一個(gè)合理區(qū)間,反復(fù)這樣調(diào)整到第一層,每輪調(diào)整都有一個(gè)學(xué)習(xí)率,調(diào)整結(jié)束后,網(wǎng)絡(luò)越來(lái)越合理。

step函數(shù)換成邏輯回歸函數(shù)σ(z) = 1 / (1 + exp(–z)),無(wú)論x落在哪個(gè)區(qū)域,最后都有一個(gè)非0的梯度可以使用,落在(0,1)區(qū)間。

雙曲正切函數(shù)The hyperbolic tangent function tanh (z) = 2σ(2z) – 1,在(-1,1)的區(qū)間。

The ReLU function ReLU (z) = max (0, z),層次很深時(shí)不會(huì)越傳遞越小。

多分類(lèi)時(shí),使用softmax(logistics激活函數(shù))最為常見(jiàn)。

使用MLP多分類(lèi)輸出層為softmax,隱層傾向于使用ReLU,因?yàn)橄蚯皞鬟f時(shí)不會(huì)有數(shù)值越來(lái)越小得不到訓(xùn)練的情況產(chǎn)生。

以mnist數(shù)據(jù)集為例

import tensorflowastf# construction phasen_inputs =28*28# MNIST# 隱藏層節(jié)點(diǎn)數(shù)目n_hidden1 =300n_hidden2 =100n_outputs =10X=tf.placeholder(tf.float32, shape=(None, n_inputs), name="X")y=tf.placeholder(tf.int64, shape=(None), name="y")def neuron_layer(X, n_neurons, name, activation=None): withtf.name_scope(name): n_inputs =int(X.get_shape()[1]) # 標(biāo)準(zhǔn)差初始設(shè)定,研究證明設(shè)為以下結(jié)果訓(xùn)練更快 stddev =2/ np.sqrt(n_inputs) # 使用截?cái)嗟恼龖B(tài)分布,過(guò)濾掉極端的數(shù)據(jù),做了一個(gè)初始權(quán)重矩陣,是input和neurons的全連接矩陣 init =tf.truncated_normal((n_inputs, n_neurons), stddev=stddev) W =tf.Variable(init, name="weights") # biases項(xiàng)初始化為0 b=tf.Variable(tf.zeros([n_neurons]), name="biases") # 該層輸出 z=tf.matmul(X, W) +b # 根據(jù)activation選擇激活函數(shù) ifactivation=="relu": returntf.nn.relu(z) else: returnzwithtf.name_scope("dnn"):# 算上輸入層一共4層的dnn結(jié)構(gòu) hidden1 = neuron_layer(X, n_hidden1,"hidden1", activation="relu") hidden2 = neuron_layer(hidden1, n_hidden2,"hidden2", activation="relu") # 直接輸出最后結(jié)果值 logits = neuron_layer(hidden2, n_outputs,"outputs")# 使用TensorFlow自帶函數(shù)實(shí)現(xiàn),最新修改成dense函數(shù)from tensorflow.contrib.layers import fully_connectedwithtf.name_scope("dnn"): hidden1 = fully_connected(X, n_hidden1, scope="hidden1") hidden2 = fully_connected(hidden1, n_hidden2, scope="hidden2") logits = fully_connected(hidden2, n_outputs, scope="outputs", activation_fn=None)# 使用logits(網(wǎng)絡(luò)輸出)計(jì)算交叉熵,取均值為誤差withtf.name_scope("loss"): xentropy =tf.nn.sparse_softmax_cross_entropy_with_logits(labels=y, logits=logits) loss =tf.reduce_mean(xentropy, name="loss")learning_rate =0.01withtf.name_scope("train"): optimizer =tf.train.GradientDescentOptimizer(learning_rate) training_op = optimizer.minimize(loss)withtf.name_scope("eval"): correct =tf.nn.in_top_k(logits,y,1) accuracy =tf.reduce_mean(tf.cast(correct,tf.float32))init =tf.global_variables_initializer()saver =tf.train.Saver()# Execution Phasefrom tensorflow.examples.tutorials.mnist import input_datamnist = input_data.read_data_sets("/tmp/data/")# 外層大循環(huán)跑400次,每個(gè)循環(huán)中小循環(huán)數(shù)據(jù)量50n_epochs =400batch_size =50withtf.Session()assess: init.run() forepoch inrange(n_epochs): foriteration inrange(mnist.train.num_examples // batch_size): X_batch, y_batch = mnist.train.next_batch(batch_size) sess.run(training_op, feed_dict={X: X_batch,y: y_batch}) acc_train = accuracy.eval(feed_dict={X: X_batch,y: y_batch}) acc_test = accuracy.eval(feed_dict={X: mnist.test.images,y: mnist.test.labels}) print(epoch,"Train accuracy:", acc_train,"Test accuracy:", acc_test)# 下次再跑模型時(shí)不用再次訓(xùn)練了save_path = saver.save(sess,"./my_model_final.ckpt")# 下次調(diào)用withtf.Session()assess: saver.restore(sess,"./my_model_final.ckpt") #orbetter, use save_path X_new_scaled = mnist.test.images[:20] Z = logits.eval(feed_dict={X: X_new_scaled}) y_pred = np.argmax(Z, axis=1)

超參數(shù)設(shè)置

隱層數(shù)量:一般來(lái)說(shuō)單個(gè)隱層即可,對(duì)于復(fù)雜問(wèn)題,由于深層模型可以實(shí)現(xiàn)淺層的指數(shù)級(jí)別的效果,且每層節(jié)點(diǎn)數(shù)不多,加至overfit就不要再加了。

每層神經(jīng)元數(shù)量:以漏斗形逐層遞減,輸入層最多,逐漸features更少代表性更強(qiáng)。

激活函數(shù)選擇(activation function):隱層多選擇ReLU,輸出層多選擇softmax

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:【機(jī)器學(xué)習(xí)】人工神經(jīng)網(wǎng)絡(luò)ANN

文章出處:【微信號(hào):AI_shequ,微信公眾號(hào):人工智能愛(ài)好者社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    詳解深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

    在如今的網(wǎng)絡(luò)時(shí)代,錯(cuò)綜復(fù)雜的大數(shù)據(jù)和網(wǎng)絡(luò)環(huán)境,讓傳統(tǒng)信息處理理論、人工智能與人工神經(jīng)網(wǎng)絡(luò)都面臨巨大的挑戰(zhàn)。近些年,深度
    的頭像 發(fā)表于 01-11 10:51 ?1858次閱讀
    <b class='flag-5'>詳解</b><b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>、<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>與卷積<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的應(yīng)用

    人工神經(jīng)網(wǎng)絡(luò)原理及下載

    人工神經(jīng)網(wǎng)絡(luò)是根據(jù)人的認(rèn)識(shí)過(guò)程而開(kāi)發(fā)出的一種算法。假如我們現(xiàn)在只有一些輸入和相應(yīng)的輸出,而對(duì)如何由輸入得到輸出的機(jī)理并不清楚,那么我們可以把輸入與輸出之間的未知過(guò)程看成是一個(gè)“網(wǎng)絡(luò)”,通過(guò)不斷地給
    發(fā)表于 06-19 14:40

    應(yīng)用人工神經(jīng)網(wǎng)絡(luò)模擬污水生物處理

    應(yīng)用人工神經(jīng)網(wǎng)絡(luò)模擬污水生物處理(1.浙江工業(yè)大學(xué)建筑工程學(xué)院, 杭州 310014; 2.鎮(zhèn)江水工業(yè)公司排水管理處,鎮(zhèn)江 212003)摘要:針對(duì)復(fù)雜的非線性污水生物處理過(guò)程,開(kāi)發(fā)了徑向基函數(shù)的人工
    發(fā)表于 08-08 09:56

    人工神經(jīng)網(wǎng)絡(luò)課件

    人工神經(jīng)網(wǎng)絡(luò)課件
    發(fā)表于 06-19 10:15

    人工神經(jīng)網(wǎng)絡(luò)算法的學(xué)習(xí)方法與應(yīng)用實(shí)例(pdf彩版)

    物體所作出的交互反應(yīng),是模擬人工智能的一條重要途徑。人工神經(jīng)網(wǎng)絡(luò)與人腦相似性主要表現(xiàn)在:①神經(jīng)網(wǎng)絡(luò)獲取的知識(shí)是從外界環(huán)境學(xué)習(xí)得來(lái)的;②各
    發(fā)表于 10-23 16:16

    【專(zhuān)輯精選】人工智能之神經(jīng)網(wǎng)絡(luò)教程與資料

    電子發(fā)燒友總結(jié)了神經(jīng)網(wǎng)絡(luò)”為主題的精選干貨,今后每天一個(gè)主題為一期,希望對(duì)各位有所幫助?。c(diǎn)擊標(biāo)題即可進(jìn)入頁(yè)面下載相關(guān)資料)人工神經(jīng)網(wǎng)絡(luò)算法的學(xué)
    發(fā)表于 05-07 19:18

    人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)方法有哪些?

    人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)是一種類(lèi)似生物神經(jīng)網(wǎng)絡(luò)的信息處理結(jié)構(gòu),它的提出是為了解決一些非線性,非平穩(wěn),復(fù)雜的實(shí)際問(wèn)題。那有哪些辦法能實(shí)現(xiàn)人工
    發(fā)表于 08-01 08:06

    卷積神經(jīng)網(wǎng)絡(luò)深度卷積網(wǎng)絡(luò):實(shí)例探究及學(xué)習(xí)總結(jié)

    深度學(xué)習(xí)工程師-吳恩達(dá)》03卷積神經(jīng)網(wǎng)絡(luò)深度卷積網(wǎng)絡(luò):實(shí)例探究 學(xué)習(xí)總結(jié)
    發(fā)表于 05-22 17:15

    解析深度學(xué)習(xí):卷積神經(jīng)網(wǎng)絡(luò)原理與視覺(jué)實(shí)踐

    解析深度學(xué)習(xí):卷積神經(jīng)網(wǎng)絡(luò)原理與視覺(jué)實(shí)踐
    發(fā)表于 06-14 22:21

    【AI學(xué)習(xí)】第3篇--人工神經(jīng)網(wǎng)絡(luò)

    `本篇主要介紹:人工神經(jīng)網(wǎng)絡(luò)的起源、簡(jiǎn)單神經(jīng)網(wǎng)絡(luò)模型、更多神經(jīng)網(wǎng)絡(luò)模型、機(jī)器學(xué)習(xí)的步驟:訓(xùn)練與預(yù)測(cè)、訓(xùn)練的兩階段:正向推演與反向傳播、
    發(fā)表于 11-05 17:48

    怎么解決人工神經(jīng)網(wǎng)絡(luò)并行數(shù)據(jù)處理的問(wèn)題

    本文提出了一個(gè)基于FPGA 的信息處理的實(shí)例:一個(gè)簡(jiǎn)單的人工神經(jīng)網(wǎng)絡(luò)應(yīng)用Verilog 語(yǔ)言描述,該數(shù)據(jù)流采用模塊化的程序設(shè)計(jì),并考慮了模塊間數(shù)據(jù)傳輸信號(hào)同 步的問(wèn)題,有效地解決了人工神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 05-06 07:22

    卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

    卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用轉(zhuǎn)載****地址:http://fcst.ceaj.org/CN/abstract/abstract2521.shtml深度學(xué)習(xí)是機(jī)器學(xué)習(xí)
    發(fā)表于 08-02 10:39

    神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)》講義

    神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)》講義
    發(fā)表于 07-20 08:58 ?0次下載

    卷積神經(jīng)網(wǎng)絡(luò)深度神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點(diǎn) 卷積神經(jīng)網(wǎng)絡(luò)深度神經(jīng)網(wǎng)絡(luò)的區(qū)別

    深度神經(jīng)網(wǎng)絡(luò)是一種基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法,其主要特點(diǎn)是由多層神經(jīng)元構(gòu)成,可以根據(jù)數(shù)據(jù)自動(dòng)調(diào)整神經(jīng)
    發(fā)表于 08-21 17:07 ?3877次閱讀

    深度學(xué)習(xí)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)作為其中的重要分支,已經(jīng)在多個(gè)領(lǐng)域取得了顯著的應(yīng)用成果。從圖像識(shí)
    的頭像 發(fā)表于 07-02 18:19 ?756次閱讀