人工智慧是使計算機能夠模擬人類認知行爲或智能的任何代碼、算法或技術。機器學習(ML)是人工智慧的一個子集,它使用統計方法使機器能夠通過經驗學習和改進。深度學習是機器學習的一個子集,使得多層神經網絡的計算成爲可能。機器學習被看作是淺層學習,而深層學習被看作是抽象的層次學習。
機器學習涉及廣泛的概念。下面列出了這些概念;
- supervised
- unsupervised
- reinforcement learning
- linear regression
- cost functions
- overfitting
- under-fitting
- hyper-parameter, etc.
在監督學習中,我們學習從標記數據預測值。一種ML技術有助於分類,目標值是離散值,例如貓和狗。機器學習中的另一個可能會有幫助的技術是回歸。回歸作用於目標值。目標值是連續值;例如,可以使用回歸分析股市數據。
在無監督學習中,我們從沒有標記或結構的輸入數據進行推理。如果我們有一百萬份醫療記錄,我們必須弄清楚它的意義,找到潛在的結構、異常點或檢測異常,我們就使用聚類技術將數據劃分爲廣泛的聚類。
數據集分爲訓練集、測試集、驗證集等。
2012年的突破,使深度學習理念凸顯。一種算法使用2個gpu和大數據等最新技術成功地將100萬張圖像分爲1000類。
Relating Deep Learning and Traditional Machine Learning
傳統機器學習模型面臨的主要挑戰之一是一個稱爲特徵提取的過程。程式設計師需要明確地告訴計算機需要注意的特性。這些功能將有助於作出決定。
將原始數據輸入到算法中很少奏效,因此特徵提取是傳統機器學習工作流的關鍵部分。
這給程式設計師帶來了巨大的責任,而算法的效率在很大程度上取決於程式設計師的創造力。對於複雜的問題,如物體識別或手寫識別,這是一個巨大的問題。
深度學習具有學習多層次表示的能力,是幫助我們自動提取特徵的少數方法之一。可以假設較低層執行自動特徵提取,幾乎不需要程式設計師的指導。