中銀全幣種信用卡
2019年12月05日
第B11版:澳聞
澳門虛擬圖書館

人工智能強化式學習模式

人工智能強化式學習模式

眾所周知,人工智能系統本身有着學習能力,學習模式有三,即:一、監督式學習(Supervised Learning);二、非監督式學習(Unsupervised Learning);三、強化式學習(Reinforcement Learning)。

前兩種學習模式早前已講述,現介紹強化式學習,它跟監督式學習及非監督式學習最大分別在於它沒有任何數據作學習之用,監督式學習及非監督式學習在學習事前皆具備有數據(Training Dataset)作事先學習之用,強化式學習可以理解為從得分或扣分中學習,每做一樣事都會有機制為它打分數,做得對得分,做得不對扣分,得分或扣分多與少有既定機制計算,做得完全正確的得分最高,做得一般的,得分低一些,但如果做得完全不對,會扣最高分等,如此類推。簡單來說,做正確得分,做錯扣分,透過打分(得分和扣分)機制來從中學習。

例如:無人駕駛汽車內必須具備定位感應器、視像攝錄鏡頭、雷射探測器、雷達感應器、實時交通導航(GPS)等,其中具備人工智能作駕駛導航之用,我們絕不會用過去路面的數據來讓無人車學習怎樣駕駛汽車,學習的模式就採用強化式學習,例如切線前要打燈,就加分;切線無打燈,就扣分;超速駕駛,就扣分;不超速,就加分等,不需多久,無人車就會學習到要規行矩步,才能獲取高分。我們透過這打分機制,緊緊地約束着無人駕駛車的所有行為。

學勤進修教育中心電腦及手機專科導師 周柏堅

2019-12-05 學勤進修教育中心電腦及手機專科導師 周柏堅 1 1 澳门日报 content_13748.html 1 人工智能強化式學習模式 /enpproperty-->