機器學習已經被證明是很有用的,但也容易被假設可以解決所有問題、適用于所有情況。和其他工具一樣,機器學習在特定領域很有用處,特別是那些你一直都知道有、但永遠無法雇傭足夠的人來解決的問題;或者是那些有明確目標、但沒有明確實現方法的問題。
盡管如此,每個企業組織都可以以某種方式利用機器學習,在埃森哲最近的一項調查中,有42%的高管表示,他們預計到2021年我們幾乎所有創新項目背后都有人工智能的支持。但是,如果除去炒作的話你能得到更好的結果,通過了解機器學習能做什么、不能做什么,避免常見的誤區。
誤區1:機器學習就是人工智能
機器學習和人工智能經常當作是同義詞,機器學習是從研究實驗室走出現實世界最成功的一項技術,而人工智能則是一個廣泛的領域,覆蓋了計算機視覺、機器人和自然語言處理等領域,以及不包含機器學習的約束滿足等方法。可以把人工智能看到一切能讓機器變聰明的方法。所有這些都不是一些人擔心會與人類競爭甚至是攻擊人類的那種“人工智能”。
你要謹慎看待各種流行詞匯,盡量做到精準。機器學習是關于學習模式和預測大數據集的結果;其結果可能看起來很“聰明”,但核心是以前所未有的速度和規模運用統計學。
誤區2:所有數據都是有用的
要做機器學習的話就需要數據,但并非所有數據都可用于機器學習。為了訓練系統,你需要有代表性的數據,以涵蓋機器學習系統需要處理的模式和結果。你所需的數據不應該包含那些不相關的模式(例如照片顯示所有站立起來的男士和所有坐著的女士,或者所有車輛都在車庫中,所有自行車都在泥濘的場地中),因為你創建的機器學習模型將反映那些過于具體的模式,在你使用的數據中心查找這些模式。所有用于訓練的數據都需要貼上標簽,并且標記上那些與你向機器學習系統提問相匹配的特征,這就需要大量的工作。
不要假設你已經擁有干凈的、清晰的、具有代表性或易于標記的數據。
誤區3:你總是需要大量的數據
最近在圖像識別、機器閱讀理解、語言翻譯和其他領域所取得的重大進展,主要是因為現在我們有了更好的工具、能夠并行處理大量數據的GPU等計算硬件、以及已經標記的大型數據集,包括ImageNet和Stanford Question Answering Datase。但是,因為有一種名為轉移學習的技巧,所以你并不總是需要大量數據才能在特定領域獲得良好結果;相反,你可以訓練機器學習系統如何使用一個大型數據集進行學習,然后將其轉移到你自己的小型訓練數據集中去。這就是Salesforce和Microsoft Azure的自定義視覺API的工作原理:你只需要30-50張圖像即可顯示想要分類的內容以獲得好的結果。
轉移學習讓你使用相對較少的數據就可以為你的問題定制預先訓練好的系統。
誤區4:任何人都可以建立一個機器學習系統
有很多用于機器學習的開源工具和框架,以及無數課程向教你如何使用機器學習。但機器學習仍然是一項專有技術;你需要知道如何準備數據并對其進行分區、訓練和測試,你需要知道如何選擇最佳算法以及使用何種啟發式算法,如何將其轉化為可靠的生產系統。你還需要監控系統以確保隨時間推移結果保持相關性;無論你所在市場的變化,還是你的機器學習系統足夠好,最終你都會遇到不同的客戶群,你需要持續檢查該模型是否與你的問題相一致。
正確利用機器學習需要經驗;如果你剛剛起步的時候,可以借助API預先訓練可以從代碼中調用的模型,同時聘用數據科學專家和機器學習專家來構建自定義系統。
誤區5:數據中所有模式都是有用的
哮喘患者、胸痛或心臟病患者、任何100歲以上老人的肺炎存活率遠高于預期。不錯,實際上,一套簡單的、設計可自動發送住院通知的機器學習系統可能會通知他們回家(一種基于規則的系統,用相同的數據進行訓練,就像神經網絡那樣)。之所以存活率這么高,是因為肺炎非常危險,患者會被立即送到醫院住院。
這個系統從數據中看到了一個有效的模式;這對于選擇誰需要住院來說并不是一種有用的模式(但是它可以幫助保險公司來預測治療費用)。更危險的是,你并不知道你的數據集中有這種無用的反數據集,除非你已經知道它的存在。
在其他情況下,一個系統可以學習一種有效的模式(比如一種有爭議的面部識別系統,可以從自拍中準確預測性取向),因為它沒有清晰而明顯的解釋,所以是無用的(在這種情況下,照片會顯示出一些社交線索,例如拍照姿勢,而不是顯示天生的某些特征)。
“黑匣子”模型是有效的,但沒有說清楚它們到底學到了什么模式。像通用附加模型這樣的則更透明一些,可理解的算法可以讓我們更清楚模型的學習內容,從而可以決定是否適合部署。
誤區6:隨時可以使用增強學習
如今幾乎所有在使用中的機器學習系統都采用了監督式學習;在大多數情況下,系統是基于明確標記的數據集進行訓練,在準備這些數據集的過程中人類也參與其中。組織這些數據集需要時間和精力,所以人們對非監督形式的學習、特別是強化學習(RL)有很大的興趣——強化學習是指學習者通過反復試錯,通過與環境交互、預測正確行為得到獎勵。DeepMind的AlphaGo系統結合使用增強學習與監督式學習,擊敗高級Go玩家,而由卡內基梅隆大學團隊打造的Libratus系統結增強學習和其他兩種人工智能技術,在“無限注德州撲克”中擊敗了全球頂尖德撲選手。研究人員正在試驗將增強學習用于方方面面,從機器人到測試安全軟件。
但是在實驗室之外,增強學習并不常見。谷歌DeepMind通過學習如何更有效地進行冷卻,來降低數據中心的功耗;微軟采用了一個名為下文賭博機(Contextual Bandit)的特定且有限的增強學習版本,MSN.com的訪問者顯示個性化新聞標題。問題在于很少有現實世界的環境具有可以輕松發現的獎勵和即時反饋,特別是代理在任何事情發生前采取多項措施的時候。
誤區7:機器學習不存在偏見
因為機器學習是從數據中進行學習的,所以它會復制數據集中的任何偏見。搜索CEO的圖像,結果可能會顯示白人男性CEO的照片,因為更多的首席執行官是白人男性。但事實證明,機器學習也會放大偏見。
經常用于訓練圖像識別系統的COCO數據集有男性和女性的照片;但其中更多的女性形象是出現在廚房家電旁邊的,更多的男性形象是和電腦鍵盤、鼠標或網球拍和滑雪板一起出現的。在COCO上訓練系統,它會把男性與計算機硬件更緊密地綁定在一起。
一個機器學習系統也可能給另一個機器學習系統施加偏見。用流行的框架來培訓一個機器學習系統,用單詞來表達它們之間關系的向量,學習像“男人相對與女人就像是計算機程序員相對與家庭主婦”,或者“醫生相對于護士就像是老板相對于接待員”這樣的刻板印象。如果你使用這個系統,系統會把he和she(英語)翻譯成具有性別中性代詞的語言(如芬蘭語或土耳其語),“他們是醫生”變成“他是醫生”,“他們是護士”變成“她是護士”。
如果是在購物網站上得到類似的建議是有用的,但在涉及敏感林能夠與時就會引發問題,并且會產生反饋回路;如果你加入Facebook反對接種疫苗的組織,Facebook的推薦引擎會推薦其他關注陰謀論或者認為地球是平坦的組織。
了解機器學習中的偏見問題很重要。如果你無法消除訓練數據集中的偏差,可以使用一些技巧,例如在詞對之間規則化性別關聯,來減少偏見或將不相關的條目添加到建議中,以避免“過濾泡沫”。
誤區8:利用機器學習都是好的一面
機器學習為防病毒工具提供了強大的功能,進一步著眼于全新攻擊的行為,以便盡快發現這些行為。但同樣,黑客也在利用機器學習研究防病毒工具的防御措施,通過分析大量公共數據或以前成功的網絡釣魚事件,大規模地發起有針對性的網絡釣魚攻擊。
誤區9:機器學習將取代人類
人們常常擔心人工智能會搶了人類的工作,而且肯定會改變我們的工作方式;機器學習系統可以提高效率和合規性并降低成本。從長遠來看,人工智能將在業務中創造新的角色,并使淘汰掉當前的一些職位。但是許多機器學習實現了自動化的任務在之前是不可想象的,無論是復雜性還是規模,例如,您無法聘請足夠的人員來查看發布到社交媒體的每張圖片,以查看這些圖片中是否含有你企業的品牌特征。
現在機器學習已經開始創造了一些新的業務機會,例如通過預測性維護改善客戶體驗,并向業務決策者提供建議和支持。和前幾代的自動化一樣,機器學習可以讓員工自由使用他們的專業知識和創造力。
上一篇:捷順科技設合資公司加碼人工智能
下一篇:全球機器人激光切割市場到2022年CAGR將達到13%
推薦閱讀
史海拾趣
為了確保產品質量和滿足國際標準,Carling Technologies先后獲得了多項ISO和TS認證。這些認證不僅證明了公司在質量管理方面的實力,也為其產品在全球市場上的競爭提供了有力支持。同時,公司還建立了標準化的生產流程和質量檢測體系,確保每一款產品都能達到客戶的期望和要求。
隨著全球環保意識的日益增強,ATO SOLUTION公司積極響應綠色環保號召,將環保理念融入企業發展和產品生產中。公司采用環保材料和工藝,減少生產過程中的污染排放;同時,還加大了對可再生能源的利用和節能技術的研發,努力實現企業的綠色可持續發展。這種環保實踐不僅提升了公司的社會形象,也為公司的長期發展注入了新的動力。
這些故事框架都是基于電子行業發展的普遍趨勢和可能情況構建的,您可以根據ATO SOLUTION公司的實際情況進行調整和補充。在撰寫具體故事時,請確保內容的真實性和客觀性,避免加入主觀評價或猜測。
隨著公司實力的不斷增強和市場需求的日益全球化,Euvis Inc公司開始實施國際化戰略,積極拓展海外市場。公司在全球范圍內設立研發中心和生產基地,與當地企業建立合作關系,共同開發適合當地市場的產品。通過國際化戰略的實施,Euvis Inc公司成功實現了全球布局,為全球消費者提供了優質的產品和服務。
請注意,以上故事均為虛構內容,旨在為你提供一個關于電子行業公司發展起來的相關故事框架。如有需要,你可以根據這些框架進行進一步的創作和發揮。
隨著全球經濟的一體化,電子行業也逐漸呈現出全球化的趨勢。Connor-Winfield敏銳地把握住了這一機遇,開始實施全球化戰略。公司積極拓展海外市場,與多家國際知名企業建立了緊密的合作伙伴關系。這些合作不僅為公司帶來了更多的商業機會,也使其在全球化競爭中保持了領先地位。
進入21世紀后,隨著全球對環保和可持續發展的關注度不斷提高,迪貝電子也積極響應這一趨勢,將環保和社會責任融入到企業的經營理念中。公司投入大量資金研發更加環保、節能的產品,并積極參與各種環保公益活動。同時,迪貝電子還積極推廣綠色制造理念,通過優化生產流程、降低能耗和減少廢棄物排放等措施,實現了企業的可持續發展。
在evc下,想把一個Unicode字符的文本文件讀入一個數組 可是文件的字符數多于19的時候就會出現讀取錯誤,出現亂碼或者只能讀一部分 請問這是為什么? 其中: 該Unicode字符的文本文件是通過寫入WCHAR自建的,并沒有0xFFFE字頭,難道這會有影響?… 查看全部問答∨ |
|
故障一:觸摸偏差 現象:手指所觸摸的位置與鼠標箭頭沒有重合。 分析:安裝完驅動程序后,在進行校正位置時,沒有垂直觸摸靶心正中位置。處理方法:重新校正位置。 故障二:觸摸偏差 現象:部分區域觸摸準確,部分區域觸摸有偏差。 … 查看全部問答∨ |
使用的ep2c5t144c8的Cyclone II 中的PLL,通過Quartus II 軟件自動生成,波形仿真成功,但是在下載到FPGA后無法正常執行其功能,我想問一下: 1)對于FPGA中的PLL的輸入時鐘有沒有特殊的限制,是不是使用芯片中的CLK1~4,就可以了? & ...… 查看全部問答∨ |
本帖最后由 paulhyde 于 2014-9-15 09:44 編輯 在備戰國賽時大家休息的時候可以玩一下彩屏這個彩屏是240*360顯示的屏幕,支持觸屏 下面先進行一個錯誤演示 大家可以從上面的顯示看出,顯示可以顯示,硬件是OK的,但是掃描出 ...… 查看全部問答∨ |
本周,我的一個學生給我發了一個郵件,詢問如何Linux下如何往外設寫數據. 郵件如下.老大: 現在我有個緊急問題請教,希望你講明白點,我想知道數據是怎么從用 ...… 查看全部問答∨ |
請問各位大俠,單片機的管腳和CPLD的管腳有什么不同嗎?為什么同樣的按鍵電路,在單片機里就行,到CPLD就干擾很大,是不是CPLD的管腳內部沒有上下拉電阻?而單片機有呢?兩者的管腳原理有什么不一樣?忘各位大俠指教。… 查看全部問答∨ |