數(shù)據(jù)挖掘、機器學習和深度學習之間有什么區(qū)別?
機器學習,有時也稱為計算智能,近年來已經(jīng)突破了一些技術障礙,并在機器人、機器翻譯、社交網(wǎng)絡、電子商務,甚至醫(yī)藥和醫(yī)療保健等領域取得了重大進展。機器學習是人工智能的一個領域,其目標是開發(fā)學習計算技術以及構建能夠自動獲取知識的系統(tǒng)。
學習系統(tǒng)是一種計算機程序,它通過成功解決過去的問題積累的經(jīng)驗做出決策。盡管應用時間不長,但是有許多不同的學習算法,該領域是計算領域最熱門的領域之一,并且定期發(fā)布一些新的技術和算法。
機器學習vs人工智能
許多人認為機器學習和人工智能的含義是一樣的,但這并不十分準確。人工智能有幾種定義,這其中包含機器學習的廣泛概念。一個被廣泛接受的定義是,人工智能由依賴人類行為來解決問題的計算機制組成。換句話說,技術使計算機就像人類一樣“思考”來執(zhí)行任務。
人類能夠分析數(shù)據(jù),發(fā)現(xiàn)其中的模式或趨勢,從中進行更明智的分析,然后使用結論做出決策。在某種意義上,人工智能也遵循同樣的原則。通常,人們完成任務越多,就越熟練。這是具有學習能力的結果。經(jīng)常重復或執(zhí)行相關程序對人們來說是一種培訓。在人工智能系統(tǒng)中也會發(fā)生類似的事情:公開獲取或記錄在專用平臺上的數(shù)據(jù)用作人工智能算法的培訓。
那么培訓是如何完成的?為此目的有幾種算法。這一切都取決于應用程序以及它們背后的組織或人員。在這里,最重要的是知道在這一點上機器學習是有意義的。
什么是機器學習?
機器學習也是一個有多種定義的概念,但在其核心,機器學習是一個可以根據(jù)自身經(jīng)驗自主修改其行為的系統(tǒng),其人為干擾很小。這種行為修改基本上包括建立邏輯規(guī)則,目的是提高任務的性能,或者根據(jù)應用程序做出最適合場景的決策。這些規(guī)則是根據(jù)分析數(shù)據(jù)中的模式識別生成的。
例如,如果一個人在搜索引擎中鍵入“勇敢”這個詞,該服務需要分析一系列參數(shù)來決定是否顯示類似于激怒或勇敢的結果,這可能有兩種含義。在眾多可用參數(shù)中有用戶搜索歷史:例如,如果在尋找“勇敢”之前幾分鐘,則最有可能出現(xiàn)第二種意義。這是一個非常簡單的例子,但它說明了機器學習的一些重要方面。
重要的是,系統(tǒng)必須根據(jù)大量數(shù)據(jù)進行分析,這是搜索者必須放棄的一個標準,因為他們接收了數(shù)百萬次訪問,因此這是一個培訓標準。
另一個方面是持續(xù)的數(shù)據(jù)輸入,有利于識別新標準。假設“勇敢”這個詞成為與文化運動相關的俚語,通過機器學習,搜索引擎將能夠識別指向該術語的新含義的模式,并且在一段時間之后,將能夠在搜索結果中考慮它。
機器學習有幾種方法。眾所周知的一種方法稱之為“深度學習”,其中大量數(shù)據(jù)來自多層人工神經(jīng)網(wǎng)絡,這些算法受到解決復雜問題的大腦神經(jīng)元結構的啟發(fā),例如圖像中的物體識別。
機器學習的例子
機器學習的使用正在演變成各種各樣的應用,人們當今擁有的許多技術資源都基于人工智能和機器學習。
自治數(shù)據(jù)庫 - 借助機器學習,自治數(shù)據(jù)庫處理以前由管理人員(DBA)執(zhí)行的若干任務,允許這些專業(yè)人員處理其他活動,從而降低因為人為錯誤導致的應用程序不可用的風險。
打擊支付系統(tǒng)中的欺詐行為 - 每秒都會產(chǎn)生各種信用卡欺詐和其他支付方式的嘗試。機器學習允許反欺詐系統(tǒng)在成功之前識別其中的大部分。
文本翻譯——翻譯必須考慮場景、區(qū)域表達式和其他參數(shù)。由于采用機器學習,自動翻譯越來越精確。
內容推薦——視頻和音頻流平臺使用機器學習來分析用戶查看或拒絕的內容的歷史記錄,以便為他們提供符合其意愿的建議。
營銷和銷售——根據(jù)以前的購買推薦產(chǎn)品和服務的網(wǎng)站使用機器學習來分析購買歷史,并推廣客戶可能感興趣的其他項目。這種捕獲數(shù)據(jù)、分析數(shù)據(jù)并使用它來定制購物體驗的能力或實施營銷活動是零售業(yè)的未來。
運輸——分析數(shù)據(jù)以識別模式和趨勢對于運輸行業(yè)至關重要,這取決于開發(fā)更有效的路線,并預測潛在問題以提高可靠性和盈利能力。機器學習數(shù)據(jù)建模和分析方面是運輸廠商、公共交通和業(yè)內其他組織的重要工具。
石油和天然氣 - 機器學習有助于發(fā)現(xiàn)新的能源,分析土壤中的礦物質,預測煉油廠傳感器的故障,加速石油的分配,使其更加高效和經(jīng)濟。在這個行業(yè)中,機器學習應用程序的數(shù)量是巨大的,并且持續(xù)增長。
醫(yī)療保健 - 由于可穿戴設備和傳感器的出現(xiàn),使醫(yī)療保健專業(yè)人員能夠實時訪問患者數(shù)據(jù),因此機器學習是醫(yī)療保健領域不斷發(fā)展的趨勢。該技術還可以幫助醫(yī)學專家分析數(shù)據(jù),以識別趨勢或警報,從而改善診斷和治療。
機器學習中使用的方法
兩種最廣泛采用的機器學習方法是監(jiān)督學習和無監(jiān)督學習,但它們并不是唯一的方法。
通過標記示例訓練監(jiān)督學習算法,作為已知所需輸出的輸入。例如,設備可能具有標記為“F”(失敗)或“E”(執(zhí)行)的數(shù)據(jù)點。學習算法接收一組輸入以及相應的正確輸出,并通過將實際輸出與正確輸出進行比較來學習以發(fā)現(xiàn)錯誤。然后它修改結算模型。通過分類、回歸和梯度增強等方法,監(jiān)督學習使用標準來預測附加的非標記數(shù)據(jù)中的標簽值。監(jiān)督學習通常用于歷史數(shù)據(jù)預測可能的未來事件的應用中。例如,它可以預測信用卡交易何時可能是欺詐性的,或者哪些投保人傾向于要求其政策。
非監(jiān)督學習用于針對沒有歷史標簽的數(shù)據(jù)。“正確答案”未向系統(tǒng)報告。算法必須找出所顯示的內容。目標是探索數(shù)據(jù)并在其中找到一些結構。無監(jiān)督學習適用于交易數(shù)據(jù)。例如,它可以識別具有相似屬性的客戶群,然后可以在營銷活動中對其進行類似處理;或者它可以找到分隔不同客戶群的關鍵屬性。常用的技術包括自組織映射、鄰近映射、k-均值分組和分解為奇異值。這些算法還用于分割文本主題、推薦項目和識別數(shù)據(jù)中的差異點。
半監(jiān)督學習用于與監(jiān)督學習相同的應用程序,但處理有標簽和無標簽的數(shù)據(jù)進行培訓——通常是用大量無標簽數(shù)據(jù)標記的少量數(shù)據(jù)(因為沒有標簽的數(shù)據(jù)更便宜,并且需要花費更少的精力來獲取)。這類學習可用于分類、回歸和預測等方法。當與標簽相關的成本太高而無法實現(xiàn)完全標記的培訓過程時,半監(jiān)督學習非常有用。其典型例子包括在網(wǎng)絡攝像頭上識別人臉。
強化學習通常用于機器人、游戲和導航。有了它,算法通過嘗試和錯誤發(fā)現(xiàn),哪些行為會帶來更大的回報。這種類型的學習有三個主要組成部分:代理(學習者或決策者)、環(huán)境(代理與之交互的所有內容)和行動(代理可以做什么)。目標是讓代理選擇在給定時間段內最大化預期回報的行動。如果代理遵循一個好的政策,可以更快地實現(xiàn)目標。因此,強化學習的重點是找出最佳策略。
數(shù)據(jù)挖掘、機器學習和深度學習之間有什么區(qū)別?
雖然所有這些方法都有相同的目標,提取可用于決策的見解、模式和關系,但它們具有不同的方法和功能。
數(shù)據(jù)挖掘可以被視為從數(shù)據(jù)中提取洞察力的許多不同方法的超集。它可能涉及傳統(tǒng)的統(tǒng)計方法和機器學習。數(shù)據(jù)挖掘應用來自多個區(qū)域的方法來識別數(shù)據(jù)中先前未知的模式。這可能包括統(tǒng)計算法、機器學習、文本分析、時間序列分析和其他分析領域。數(shù)據(jù)挖掘還包括數(shù)據(jù)存儲和操作的研究和實踐。
通過機器學習,目的是了解數(shù)據(jù)的結構。因此,統(tǒng)計模型背后有一個理論是經(jīng)過數(shù)學證明的,但這要求數(shù)據(jù)也滿足某些假設。機器學習是從使用計算機檢查數(shù)據(jù)結構的能力發(fā)展而來的,即使人們不知道這種結構是什么樣子的。機器學習模型的測試是新數(shù)據(jù)中的驗證錯誤,而不是證明空假設的理論測試。由于機器學習通常使用迭代的方法從數(shù)據(jù)中學習,因此可以輕松地自動學習。這些步驟通過數(shù)據(jù)執(zhí)行,直到找到一個可靠的標準。
深度學習結合了計算能力的進步和特殊類型的神經(jīng)網(wǎng)絡,以學習大量數(shù)據(jù)中的復雜模式。深度學習技術是當今最先進的技術,用于識別圖片中的對象和語音中的單詞。研究人員正在嘗試將模式識別方面的成功應用于更復雜的任務,例如機器翻譯、醫(yī)療診斷以及許多其他社會和企業(yè)問題。
盡管人工智能和機器學習的概念早已出現(xiàn),但它們開始成為主流應用的一部分。但是,現(xiàn)在仍處于起步階段。如果人工智能和機器學習有用并且令人印象深刻,當?shù)玫礁玫挠柧毢透倪M時,其實施將會更加有效。
關鍵詞: 數(shù)據(jù)挖掘 機器學習 深度學習
您可能也感興趣:
今日熱點
為您推薦
隔離險受不少年輕人推崇 不僅看理賠條款還要看免責條款
北京發(fā)布社保對賬單公告 4月起可查詢電子版?zhèn)€人繳費信息
廣東啟動車險市場專項整治行動 保護消費者合法權益
更多
- CEVA Logistics 與 Kodiak Robotics 攜手推出自動駕駛陸運服務
- 合肥將爭創(chuàng)國家科技創(chuàng)新中心 打造極具競爭力的創(chuàng)新企業(yè)集群
- 英飛凌推出新天線調諧器,讓5G智能手機擁有超高的數(shù)據(jù)傳輸速...
- 中國 AR/VR 行業(yè)趨勢轉變,凸顯智能眼鏡對創(chuàng)新 3D 打印處...
- 貿(mào)澤電子2022 Empowering Innovation Together計劃起航 推出關于RISC-V的新播客
- 萊迪思加入OPC基金會
- 互聯(lián)工廠:工業(yè)連接助推工業(yè)4.0
- Qucell選擇Radisys來建設5G小基站
排行
最近更新
- 數(shù)據(jù)挖掘、機器學習和深度學習之間有什么區(qū)別?
- 幼兒園本地及遠程視頻監(jiān)控系統(tǒng)設計方案
- 雙聲道音頻功率放大器電路圖分析
- 垂直度、平行度、直線度測量簡介
- 2021年全國消協(xié)組織為消費者挽回經(jīng)濟損失15.2億元
- 新疆與七家國有金融機構簽署戰(zhàn)略合作協(xié)議
- 一汽-大眾高爾夫GTI運動轎車,7.1秒多破百,23.18萬超值!
- Web3教程協(xié)議RabbitHole發(fā)放NFT紀念徽章
- 以太坊網(wǎng)絡Gas費已降至15gwei
- 朔州農(nóng)商銀行:多措并舉助推各項經(jīng)營業(yè)務落地見效
- 傳祺持續(xù)向上,將發(fā)展態(tài)勢拉回主流展現(xiàn)非凡實力
- 英國疫情賴俄烏?
- 2021年光通信行業(yè)龍頭股有哪些?
- 夢舟股份屬于什么概念板塊?夢舟股份相關概念板塊解析
- 集裝箱制造上市公司一覽,2021年集裝箱制造上市公司有哪些?
- 第三代核電上市公司有哪些,第三代核電上市公司名單
- 宏達礦業(yè)是什么概念?宏達礦業(yè)所屬概念解析
- 達蘆那韋概念股票有哪些?達蘆那韋概念股一覽表
- EMC測試簡介
- 一位從厭倦調試NRF24L01無線模塊到成功的收發(fā)經(jīng)驗分享
- 高速變頻電機測試解決方案
- 云霄縣重拳整治違法建筑 群眾真心點贊
- 淺談數(shù)據(jù)科學在現(xiàn)階段企業(yè)中的應用與快速發(fā)展
- 齊魯詩人 | 張浩程:春雨有感(三首)
- 這代債券人還有那么幸運嗎?
- 美國嘻哈巨星Akon即將聯(lián)合Element.Black發(fā)行音樂盲盒
- 首批“自測版”新冠抗原檢測試劑盒來了?《科創(chuàng)板日報》12日...
- 實錘自測抗原檢測龍頭萬孚生物了 12日最新消息
- 央視都報道了!實錘鹽野義 抗病毒特效神藥。
- 科普小貼士丨警惕!并不遙遠的急性白血病