欧美一区免费,欧美亚洲精品一区,香蕉成人啪国产精品视频综合网,综合久久国产

中國金屬材料流通協(xié)會,歡迎您!

English服務(wù)熱線:010-59231580

搜索

人工智能與大數(shù)據(jù)開發(fā)的12個注意點

       機器學習是人工智能研究領(lǐng)域的重要方向,在大數(shù)據(jù)時代里,對數(shù)據(jù)采集、挖掘、應(yīng)用的技術(shù)越來越受到矚目,并越來越創(chuàng)造出巨大的價值。

      那么在人工智能和大數(shù)據(jù)的開發(fā)過程中,有哪些特別需要注意的要點?人工智能領(lǐng)域的算法大師、華盛頓大學教授Pedro Domingos對此進行了深入思考。《智能Web算法》(第2版)中,對Pedro Domingos教授的觀點進行了高度的概括,提煉出12個注意點,為行業(yè)開發(fā)實踐提供了重要參考。


注意點1:你的數(shù)據(jù)未必可靠


在實際應(yīng)用中,有很多原因會導(dǎo)致你的數(shù)據(jù)是不可靠的。因此,當你將數(shù)據(jù)用于解決問題前,必須經(jīng)常留心來檢查數(shù)據(jù)是否值得信賴。如果基于糟糕的數(shù)據(jù)來挖掘,無論多么聰明的人也永遠只會獲得糟糕的結(jié)果。下面列舉了一些常見的可導(dǎo)致數(shù)據(jù)可靠性問題的因素:


用于開發(fā)的數(shù)據(jù),往往和實際情況下的數(shù)據(jù)分布不同。

例如也許你想把用戶按照身高劃分為“高”、“中等”、“矮”三檔,但如果系統(tǒng)開發(fā)時使用的數(shù)據(jù)集里最低用戶的身高是6英尺(184cm),那么很有可能你開發(fā)出來的系統(tǒng)里會把一個“僅有6英尺”的用戶稱為“矮”用戶


你的數(shù)據(jù)集中存在很多缺失數(shù)據(jù)。

事實上,除非是人為構(gòu)造的數(shù)據(jù)集合,否則很難避免缺失數(shù)據(jù)問題的發(fā)生,如何處理數(shù)據(jù)缺失的問題是很有技巧的事情。實踐中我們要么是干脆丟棄一部分殘缺的數(shù)據(jù),要么就是想辦法計算一些數(shù)值去填補這些缺失值。無論哪種方法都可能導(dǎo)致應(yīng)用結(jié)果的不穩(wěn)定


你的數(shù)據(jù)可能隨時在變化。

數(shù)據(jù)庫的表結(jié)構(gòu)可能會變,數(shù)據(jù)定義也可能會變。


你的數(shù)據(jù)可能沒有被歸一化。

假設(shè)你可能在觀察一組用戶的體重,為了能夠獲得有效的結(jié)論,首先需要對每個體重的衡量單位進行歸一化,是英鎊還是公斤,不能混淆著用。


你的數(shù)據(jù)可能并不適用于相應(yīng)的算法。

數(shù)據(jù)存在著各種各樣的形式和規(guī)范,或者叫數(shù)據(jù)類型(data types),有些是數(shù)值化的數(shù)據(jù),有些則不是。有些數(shù)據(jù)集合能被有序排列,有些則做不到。有些是離散化的數(shù)據(jù)(例如房間里的人數(shù)),另一些則是連續(xù)化的(例如氣溫或者氣壓等數(shù)據(jù))。



注意點2:計算難以瞬間完成



完成任何一個人工智能解決方案的計算,都需要一定的時間,方案的響應(yīng)速度,對商業(yè)應(yīng)用的成功與否起到十分關(guān)鍵的作用。不能總是盲目假設(shè)任何算法在所有數(shù)據(jù)集上都一定能在規(guī)定時間內(nèi)完成,你需要測試下算法的性能是否在可接受的應(yīng)用范圍內(nèi)。


以搜索引擎為例,用戶對結(jié)果返回的時長是有忍耐的限度的。如果用戶等待的時間超過10秒,50%的用戶會流失,如果等待時間超過1分鐘,90%以上的用戶會流失。在開發(fā)智能應(yīng)用系統(tǒng)時,不能為了達到更好的算法精度而忽略系統(tǒng)運算和等待的時間,否則會導(dǎo)致整個產(chǎn)品的失敗。



注意點3: 數(shù)據(jù)的規(guī)模非常重要



當我們考慮智能應(yīng)用時,數(shù)據(jù)規(guī)模是很重要的因素。數(shù)據(jù)規(guī)模的影響可以分為兩點來考察:第一點是規(guī)模會影響應(yīng)用系統(tǒng)的響應(yīng)速度,上一節(jié)我們剛提過;第二點是在很大的數(shù)據(jù)集上挖掘出有價值結(jié)果的能力會受到考驗。例如為100個用戶開發(fā)的電影或音樂推薦系統(tǒng)可能效果很好,但是同樣的算法移植到有著100000個用戶的環(huán)境里,效果可能就不盡如人意了。


其次,使用更多的數(shù)據(jù)來訓練的簡單算法,比受制于維度詛咒(Dimension Curse)的復(fù)雜算法往往有好得多的效果。類似Google這樣擁有海量數(shù)據(jù)的大型企業(yè),優(yōu)秀的應(yīng)用效果不僅來自于精妙復(fù)雜的算法,也來自于其對海量訓練數(shù)據(jù)的大規(guī)模分析挖掘。



注意點4: 不同的算法具有不同的擴展能力



我們不能假設(shè)智能應(yīng)用系統(tǒng)都可以通過簡單增加服務(wù)器的方法來擴展性能。有些算法是有擴展性的,而有些則不行。


例如如果我們要從數(shù)億的文章標題里,找出標題相似的各個組的文章,注意并不是所有的聚類算法此時都能并行化運行的,你應(yīng)該在設(shè)計系統(tǒng)的同時就考慮可擴展性。有些情況下你需要將數(shù)據(jù)切分成較小的集合,并能夠讓智能算法在各個集合上并行運行。設(shè)計系統(tǒng)時所選擇的算法,往往需要有并行化的版本,而在一開始就需要將其納入考慮,因為通常圍繞著算法還會有很多相關(guān)聯(lián)的商業(yè)邏輯和體系結(jié)構(gòu)需要一并考慮。



注意點5:并不存在萬能的方法



你可能聽說過一句諺語“當你有了把榔頭的時候,看什么東西都像釘子”,這里想表達的意思是:并不存在能夠解決所有智能應(yīng)用問題的萬能算法。


智能應(yīng)用軟件和其他所有軟件類似——具有其特定的應(yīng)用領(lǐng)域和局限性。當面對新的應(yīng)用領(lǐng)域時,一定要充分的驗證原有方法的可行性,而且你最好能嘗試用全新的視角來考察問題,因為不同的算法在解決特定的問題時才會更有效和得當。



注意點6:數(shù)據(jù)并不是萬能的



根本上看,機器學習算法并不是魔法,它需要從訓練數(shù)據(jù)開始,逐步延伸到未知數(shù)據(jù)中去。


例如假設(shè)你已經(jīng)對數(shù)據(jù)的分布規(guī)律有所了解,那么通過圖模型來表達這些先驗的知識會非常有效。除了數(shù)據(jù)以外,你還需要仔細的考慮,該領(lǐng)域有哪些先驗知識可以應(yīng)用,這對開發(fā)一個更有效的分類器會很有幫助。數(shù)據(jù)和行業(yè)經(jīng)驗結(jié)合往往能事半功倍。



注意點7:模型訓練的時間差異很大



在特定應(yīng)用中,可能某些參數(shù)的微小變化就會讓模型的訓練時間出現(xiàn)很大的差異。例如在深度神經(jīng)網(wǎng)絡(luò)訓練時就會有各種各樣的參數(shù)調(diào)節(jié)的情況發(fā)生。


人們往往會直觀的覺得調(diào)整參數(shù)時,訓練時間是基本穩(wěn)定不變的。例如假設(shè)有個系統(tǒng)是計算地球平面上任意兩點之間的距離的,那么任意給出兩個點的坐標時,計算時間差不多都是相同的。但在另一些系統(tǒng)里卻并非如此,有時細微的調(diào)整會帶來很明顯的時間差異,有時差異甚至可以大到數(shù)小時,而不是數(shù)秒。



注意點8:泛化能力是目標



機器學習實踐中最普遍存在的一個誤區(qū)是陷入處理細節(jié)中而忘了最初的目標——通過調(diào)查來獲得處理問題的普適的方法。


測試階段是驗證某個方法是否具備泛化能力(generalization ability)的關(guān)鍵環(huán)節(jié)(通過交叉驗證、外部數(shù)據(jù)驗證等方法),但是尋找合適的驗證數(shù)據(jù)集不容易。如果在一個只有幾百個樣本的集合上去訓練有數(shù)百萬維特征的模型,試圖想獲得優(yōu)秀的精度是很荒唐的。



注意點9:人類的直覺未必準確



在特征空間膨脹的時候,輸入信息間形成的組合關(guān)系會快速增加,這讓人很難像對中等數(shù)據(jù)集合那樣能夠?qū)ζ渲幸徊糠謹?shù)據(jù)進行抽樣觀察。更麻煩的是,特征數(shù)量增加時人類對數(shù)據(jù)的直覺會迅速降低。


例如在高維空間里,多元高斯分布并不是沿著均值分布,而是像一個扇貝形狀圍繞在均值附近,這和人們的主觀感受完全不同。在低維空間中建立一個分類器并不難,但是當維度增加時,人類就很難直觀的理解了。



注意點10:要考慮融入更多新特征



你很可能聽說過諺語“進來的是垃圾,出去的也是垃圾”(garbage in, garbage out),在建立機器學習應(yīng)用中這一點尤其重要。為了避免挖掘的效果失控,關(guān)鍵是要充分掌握問題所在的領(lǐng)域。通過調(diào)查數(shù)據(jù)來生成各種各樣的特征,這樣的做法會對提升分類的準確率和泛化能力有很大的幫助,僅靠把數(shù)據(jù)扔進分類器就想獲得優(yōu)秀結(jié)果的幻想是不可能實現(xiàn)的。



注意點11:要學習各種不同的模型



模型的組合(Ensemble)技術(shù)正變得越來越流行了,因為組合方法,僅需要付出少許偏見(bias)的代價,就能大大的減少算法的不確定性。在著名的Netflix算法競賽中,冠軍隊以及成績優(yōu)異隊伍們?nèi)际褂昧私M合模型方法,把超過100個模型合并在一起(在模型上疊加高層的模型形成組合)以提升效果。在人工智能用于實際應(yīng)用時,從業(yè)者普遍都認為,未來的算法一定時會通過模型組合的方法來獲得更好精度,但是這也會抬高非專業(yè)人員理解系統(tǒng)機制的門檻。



注意點12:相關(guān)關(guān)系不等同于因果關(guān)系



這一點值得反復(fù)強調(diào),我們可以通過一句調(diào)侃的話來解釋:“地球變暖、地震、龍卷風,以及其他自然災(zāi)害,都和18世紀以來全球海盜數(shù)量的減少有直接關(guān)系”。這兩個變量的變化有相關(guān)性,但是并不能說存在因果關(guān)系,因為往往存在第三類(甚至第4、5類)未被觀察到的變量在起作用。相關(guān)關(guān)系應(yīng)該看作是潛在的因果關(guān)系的一定程度的體現(xiàn),但需要進一步研究。


在開發(fā)人工智能與大數(shù)據(jù)應(yīng)用系統(tǒng)時,把握好以上十二個注意點,才能避免出現(xiàn)各種實戰(zhàn)問題,讓技術(shù)走出實驗室,走向?qū)嶋H應(yīng)用時,能更加健壯、發(fā)揮更大的作用!

 

 

來源:北京市電子科技情報研究所

返回列表

欧美一区免费,欧美亚洲精品一区,香蕉成人啪国产精品视频综合网,综合久久国产
成人白浆超碰人人人人| 中文字幕亚洲在| 亚洲高清免费观看| 精品美女被调教视频大全网站| 蜜桃一区二区三区四区| 国产三区在线成人av| 91高清视频在线| 国产又黄又大久久| 日韩综合在线视频| 夜夜精品浪潮av一区二区三区| 久久久影视传媒| 精品久久久网站| 夜夜嗨av一区二区三区| 六月丁香婷婷久久| 免费成人性网站| 三级在线观看一区二区| 岛国av在线一区| 毛片av中文字幕一区二区| 国产91精品久久久久久久网曝门 | 毛片不卡一区二区| 成人国产免费视频| 日韩欧美国产综合| 日韩你懂的电影在线观看| 亚洲国产精品成人久久综合一区| 欧美一卡二卡三卡四卡| 精品对白一区国产伦| 久久九九久久九九| 国产一区三区三区| 欧美一级理论片| 国产精品久久久久一区二区三区 | 色天天综合久久久久综合片| 一本一道波多野结衣一区二区| 精品久久人人做人人爽| 国产精一区二区三区| proumb性欧美在线观看| 欧美亚洲综合在线| 精品福利av导航| 成人精品一区二区三区四区| 欧美激情一区二区三区全黄| 成年人国产精品| 亚洲午夜免费福利视频| 色婷婷国产精品久久包臀| 一区二区三区在线观看视频| 在线日韩一区二区| 日韩精品在线一区二区| 国产美女娇喘av呻吟久久| 国产欧美日韩在线| 日欧美一区二区| 国产精品沙发午睡系列990531| 日韩成人一级大片| 91精彩视频在线观看| 成人精品一区二区三区四区| 久久日韩粉嫩一区二区三区| 国产欧美一区二区精品仙草咪| 成人深夜福利app| 成人免费观看av| 成人激情动漫在线观看| 欧美视频在线观看一区二区| 欧美一区二区黄| 国产suv精品一区二区三区| 亚洲视频在线观看三级| 亚洲黄色av一区| 国产一区二区三区综合| 国产精品女主播av| 精品美女一区二区| 欧美三区免费完整视频在线观看| 国产精品国产精品国产专区不蜜| 91网上在线视频| 国产精品视频yy9299一区| 在线不卡中文字幕| 国产一区在线看| 日本欧美在线观看| 偷拍亚洲欧洲综合| 精品乱人伦小说| 欧美日韩高清不卡| 国产精品久久久久aaaa樱花| 国产精品国产成人国产三级| 亚洲精品视频免费看| 午夜精彩视频在线观看不卡| 国产在线精品一区二区| 99久久婷婷国产综合精品电影| 日本不卡一二三| 粉嫩欧美一区二区三区高清影视 | 精品久久一二三区| 国产精品久久久久9999吃药| 日韩精品一二三| 不卡视频在线看| 欧美精品乱人伦久久久久久| 日韩美女在线视频| 亚洲va欧美va人人爽| 国产精品美女一区二区三区| 一区二区三区成人在线视频| 99视频超级精品| 欧美肥胖老妇做爰| 婷婷国产在线综合| 色噜噜狠狠一区二区三区果冻| 亚洲色图视频网站| 一本色道久久综合亚洲精品按摩| 久久国产精品99久久人人澡| 亚洲一二三区在线观看| 2020国产精品| 国产精品高清亚洲| 亚洲精品在线电影| 中文字幕二三区不卡| 亚洲影视在线播放| 亚洲高清一区二区三区| 欧美日本高清视频在线观看| 国内精品在线播放| 国产成a人亚洲精| 亚洲精品成人a在线观看| 欧洲人成人精品| 韩国三级中文字幕hd久久精品| 国产精品久久久久久久久久久免费看| 国产成人亚洲精品狼色在线| 91精品国产福利在线观看| 图片区小说区国产精品视频| 99久久国产免费看| 久久久久久亚洲综合| 在线欧美小视频| 免费亚洲电影在线| 综合亚洲深深色噜噜狠狠网站| 国产精品视频yy9299一区| 国产精品久久久久久久岛一牛影视| 91精品国产91久久综合桃花| 亚洲激情五月婷婷| 日韩精品乱码免费| 日韩精品一区在线观看| 日日摸夜夜添夜夜添亚洲女人| 国产91对白在线观看九色| 国产精品三级视频| 波多野结衣在线一区| 国产日韩欧美a| 99久久国产免费看| 欧美一区日韩一区| 色哦色哦哦色天天综合| 激情都市一区二区| 亚洲超丰满肉感bbw| 一级精品视频在线观看宜春院 | 一级中文字幕一区二区| 国产色产综合产在线视频| 日韩美女一区二区三区四区| 欧美亚洲综合网| 色综合天天综合在线视频| 欧美福利视频导航| 色美美综合视频| 在线国产电影不卡| 精品久久久久久最新网址| 国产精品午夜久久| 欧美精选一区二区| 天天影视网天天综合色在线播放 | 亚洲男人电影天堂| 韩国午夜理伦三级不卡影院| 中文字幕一区二区三中文字幕| 在线免费精品视频| 国产精品亚洲第一区在线暖暖韩国| 一区二区三区中文字幕电影| 精品国产91久久久久久久妲己| 一本一本大道香蕉久在线精品| 韩国v欧美v日本v亚洲v| 一区二区三区国产| 日本一区二区免费在线| 欧美久久久久久蜜桃| 91麻豆免费观看| 国产精品一区二区男女羞羞无遮挡 | 91在线高清观看| 看片的网站亚洲| 一区二区三区中文字幕电影| 久久精品人人爽人人爽| 7878成人国产在线观看| 精品夜夜嗨av一区二区三区| 国产欧美一区二区精品性色超碰 | 国产日产欧美一区| 91精品国产色综合久久不卡电影| 91在线视频免费91| 国产成人亚洲综合a∨猫咪| 免费观看久久久4p| 亚洲福利视频三区| 亚洲欧美一区二区三区国产精品| 久久众筹精品私拍模特| 69成人精品免费视频| 在线观看亚洲a| 91日韩一区二区三区| 国产91精品一区二区麻豆亚洲| 久久精品理论片| 日韩va亚洲va欧美va久久| 亚洲福利视频一区二区| 一区二区三区日韩欧美| 亚洲日本一区二区| 自拍视频在线观看一区二区| 国产目拍亚洲精品99久久精品| 2020国产精品久久精品美国| 日韩西西人体444www| 日韩一区二区三区电影在线观看 | 精品久久久久久亚洲综合网| 91精品国产综合久久福利 | 亚洲1区2区3区4区| 亚洲一区免费在线观看| 亚洲激情图片一区| 亚洲国产精品久久人人爱| 一区二区三区精品视频|