機器學習閱讀筆記
機器學習是人工智慧的分支,機器學習是透過演算法,使用大量資料進行訓練,訓練完成後會產生模型。未來當有新的資料,我們可以使用訓練產生的模型進行預測。
請闡述說明三大機器學習:監督式、強化式、非監督式
監督式學習 (Supervised learning) 是電腦從標籤化 (labeled) 的資訊中分析模式後做出預測的學習方式。監督型學習有兩種主要類型:分類和迴歸。
舉例:在訓練的過程中告訴機器答案、也就是「有標籤」的資料,比如給機器各看了 1000 張蘋果和橘子的照片後、詢問機器新的一張照片中是蘋果還是橘子。
強化式學習/增強學習 (Reinforcement Learning) 的特徵是不需給機器任何的資料,讓機器直接從互動中去學習,這是最接近大自然與人類原本的學習方式。
透過觀察環境而行動,並會隨時根據新進來的資料逐步修正、以獲得最大利益。若環境的變化是離目標更接近、我們就會給予一個正向反饋 (Positive Reward),比如當機器投籃時越來越接近籃框;若離目標更遠、則給予負向反饋 (Negative Reward),比如賽車時機器越開越偏離跑道。
我們並沒有給予機器標籤資料,告訴它所採取的哪一步是正確、哪一步是錯誤的,但根據反饋的好壞,機器會自行逐步修正、最終得到正確的結果。
非監督式學習 (Unsupervised Learning) 的訓練資料不需要事先以人力處理標籤,機器面對資料時,做的處理是依照關聯性去歸類 (Co-occurance Grouping)、找出潛在規則與套路 (Association Rule Discovery)、形成集群 (Clustering),不對資訊有正確或不正確的判別。
舉例:訓練資料沒有標準答案、不需要事先以人力輸入標籤,故機器在學習時並不知道其分類結果是否正確。訓練時僅須對機器提供輸入範例,它會自動從這些範例中找出潛在的規則。資料沒標籤、讓機器自行摸索出資料規律。例如集群演算法、關聯規則探索。