首頁(yè) > 新聞動(dòng)態(tài) > 公司新聞
大數據服務(wù)還是那個(gè)大數據服務(wù)嗎?
發(fā)布時(shí)間:2018-12-21瀏覽人數:
目前“人工智能”無(wú)疑是最流行的詞之一,“大數據”是自2012年以來(lái)的流行詞之一,現在大大小小的企業(yè)服務(wù)、論壇上都充斥著(zhù)有關(guān)大數據、人工智能的內容,那么人工智能+大數據的生態(tài)模式究竟是怎樣的?
2012年大數據是個(gè)流行詞,沒(méi)想到4年過(guò)后,在一些大數據論壇上還有人會(huì )說(shuō)“如果我有大數據,我會(huì )怎樣怎樣……”好吧,如果還停留在如果上,就不該隨便上論壇演講,講不好說(shuō)不準工作都沒(méi)了?,F在大數據挖掘的技術(shù)都很成熟,更完善更系統的解決方案早已有人做得非常好。如果連數據都還沒(méi)有,那就什么都不用提了。畢竟,人工智能+大數據的生態(tài)模式已經(jīng)開(kāi)啟。
7月初,據外媒福布斯報道百度將人工智能+大數據為中國政府采集數據提供支持。7月13日,李彥宏在百度的開(kāi)放云戰略發(fā)布會(huì )上首度公開(kāi)百度開(kāi)放云“人工智能、大數據和云計算”三位一體的發(fā)展戰略。為什么谷歌和百度都在人工智能領(lǐng)域重金發(fā)力?2015年百度投入研發(fā)創(chuàng )新的資金占公司總營(yíng)收的16%。谷歌就不用說(shuō)了,在量子計算這樣離實(shí)現還遙不可及的技術(shù)上都已經(jīng)投入很多研發(fā)資金。因為互聯(lián)網(wǎng)未來(lái)向智能+發(fā)展的基礎是數據。有數,有趨向完整的海量數據是現在所有巨頭在布局人工智能+大數據生態(tài)模式的重點(diǎn)。
大數據服務(wù)還是那個(gè)大數據服務(wù)嗎?-數據分析網(wǎng) 數據獲取的最新模式:眾包
眾包是一種整合資源提升效率的方式,通過(guò)眾包可以在集合海量數據中,篩選符合一定標準的有效數據,能夠降低數據收集的成本,提高機器學(xué)習訓練的效率。有個(gè)生物學(xué)家叫戴維•休斯(David Hughes),他和作物流行病學(xué)家馬塞爾•薩拉斯(Marcel Salathé)將機器視覺(jué)技術(shù)和深度學(xué)習算法應用于農業(yè)病蟲(chóng)害智能防治上。他們將關(guān)于植物葉子的5萬(wàn)多張照片導入計算機,并運行相應的深度學(xué)習算法,針對在明亮的光線(xiàn)條件及合乎標準的背景下拍攝出植物的照片,最終程序正確識別率高達99.35%。如果在互聯(lián)網(wǎng)上隨機選取的植物葉子照片,其識別準確率將降至30%-40%,這也是目前視覺(jué)識別技術(shù)在復雜環(huán)境下尚未突破的地方。為了突破算法的限制,提高準確率,休斯和薩拉斯開(kāi)發(fā)手機應用Plant Village,讓世界各地的農民通過(guò)Plant Village上傳患病作物照片,其中包含照片如何拍攝、拍攝地點(diǎn)、年份等大量數據,并包含農業(yè)專(zhuān)家對此做出相應診斷的信息。這種方式出現之后,數據獲取的難度依舊聚焦在多維度數據資源的聚合,眾包可以解決從分散的個(gè)體獲取目標數據的問(wèn)題,但對于基礎數據資源層的擴張和占領(lǐng)依然是一場(chǎng)沒(méi)有硝煙的砸錢(qián)戰斗。
數多了怎么辦:智能計算
有些人在努力獲取數據,有些人在為數據多而未能充分利用而焦慮。
數據量級達到一定程度,再利用數據優(yōu)化服務(wù)需要人工智能算法。隨著(zhù)企業(yè)數據量的積累,挖掘數據提高效率變成了必需。比如商業(yè)應用中打車(chē)平臺的應用,國內平臺滴滴與快滴合并之后,業(yè)務(wù)線(xiàn)從出租車(chē)擴張到專(zhuān)車(chē)、順風(fēng)車(chē)、公交等領(lǐng)域,數據范圍猛增,數據量包含司機行為數據、顧客行為數據及各種路線(xiàn)數據、實(shí)時(shí)交通情況數據,定位數據等,據滴滴官方公布,滴滴出行每天處理的數據量達到70TB,由于訂單處理響應時(shí)間的要求,單純處理數據的效率已無(wú)法滿(mǎn)足實(shí)時(shí)服務(wù)的需求,必須借助人工智能算法才能夠進(jìn)一步提升服務(wù)效果。從用戶(hù)體驗角度,也需要實(shí)現提升定位精準度,提高接單率,縮短應答時(shí)間。目前滴滴內部基于海量數據+機器學(xué)習算法的推薦匹配系統,針對海量司機的交班時(shí)間、地點(diǎn)、接單/拒單情況等海量數據進(jìn)行司機畫(huà)像,以此為基礎,針對實(shí)時(shí)的訂單數據,分配訂單時(shí)實(shí)時(shí)按需分配,滿(mǎn)足服務(wù)需求。從數據應用展現更宏觀(guān)價(jià)值的角度來(lái)看,基于滴滴已有數據,可整合實(shí)時(shí)交通情況數據,包括擁堵路段、集中路線(xiàn)、集中商圈等多維度動(dòng)態(tài)數據,進(jìn)行結構化處理,達到整合一個(gè)城市的車(chē)輛分布,實(shí)現統籌平衡調度的目的。
大數據服務(wù)的現在及未來(lái):智能+生態(tài)模式
未來(lái)人工智能+大數據生態(tài)模式將更多的應用于在商業(yè)場(chǎng)景下。我們認為,大數據服務(wù)未來(lái)將有以下四種模式:
一是形成數據資源和計算資源提供平臺。當前企業(yè)數據大多僅留存于企業(yè)內部,在開(kāi)發(fā)應用上一般也只有內部應用,企業(yè)之間數據各自孤立,獨立計算,行業(yè)內尚未形成整合大數據,目前第三方數據采集、監測機構已經(jīng)開(kāi)始致力于多維數據的采集服務(wù),包括外部數據的直接采集和企業(yè)內部數據的間接采集,已有第三方在提供基礎數據庫資源。未來(lái)伴隨數據維度的豐富和數據量的擴大,第三方機構將采集并使用智能算法結構化處理形成相對完整的數據資源提供平臺,并針對些海量數據的存儲、整合及計算提供基于云端的平臺式服務(wù)。
二是出現技術(shù)服務(wù)平臺,包含提供Paas服務(wù)的開(kāi)源平臺及計算能力、大數據解決方案及技術(shù)服務(wù)支持。從目前人工智能和大數據企業(yè)發(fā)展來(lái)看,只有巨頭和少數創(chuàng )業(yè)企業(yè)掌握核心算法及存儲真正大數據,更多企業(yè)通過(guò)合作或建立產(chǎn)業(yè)聯(lián)盟的方式獲取行業(yè)或其他領(lǐng)域的數據。但對于數據的存儲、處理和應用需要技術(shù)支撐且突破這些技術(shù)需要消耗大量人力物力財力,沒(méi)必要所有企業(yè)都去做這件事。PaaS服務(wù)將數據處理能力作為模塊開(kāi)放出來(lái),使得數據挖掘技術(shù)的使用門(mén)檻和成本大幅降低,更多企業(yè)有能力利用云端數據服務(wù)創(chuàng )造附加價(jià)值。因此形成Paas服務(wù)平臺或解決方案技術(shù)服務(wù)平臺,據此可以聚合數據資源,優(yōu)化算法,提高準確率。另外也會(huì )形成基于數據存儲、處理及挖掘技術(shù)的整體服務(wù)解決方案提供商,企業(yè)可以將數據服務(wù)完全外包給第三方機構,第三方機構也可以通過(guò)這種方式在云端整合資源并優(yōu)化技術(shù),提高準確率,同時(shí)產(chǎn)生推動(dòng)行業(yè)發(fā)展的效果。
三是出現資訊服務(wù)平臺。大數據產(chǎn)業(yè)相對仍是新興產(chǎn)業(yè),發(fā)展日新月異。一方面企業(yè)需要尋找大數據資源或技術(shù)服務(wù)平臺,另外一方面第三方服務(wù)機構需要推廣宣傳自身及行業(yè)發(fā)展、技術(shù)發(fā)展現狀。在這種背景下將出現起到橋梁作用的專(zhuān)業(yè)資訊服務(wù)平臺,連接企業(yè)和第三方服務(wù)機構,同時(shí)起到發(fā)布整個(gè)行業(yè)前沿信息的作用。
四是出現交叉/垂直化服務(wù)應用?,F階段在教育、金融領(lǐng)域的垂直應用以及在未來(lái)智能營(yíng)銷(xiāo)、智能制造等交叉行業(yè)的應用。如在教育行業(yè)已出現利用積累的教、考、學(xué)環(huán)節的大數據結合深度學(xué)習算法推出個(gè)性化學(xué)習平臺,如國外的Knewton、國內的智學(xué)網(wǎng)都是這種模式。未來(lái)將延伸至農業(yè)、制造業(yè)、交通、醫療等各行各業(yè),出現如智能農業(yè)生產(chǎn)管理、智能交通、個(gè)性化精準醫療等創(chuàng )新服務(wù)。
7月初,據外媒福布斯報道百度將人工智能+大數據為中國政府采集數據提供支持。7月13日,李彥宏在百度的開(kāi)放云戰略發(fā)布會(huì )上首度公開(kāi)百度開(kāi)放云“人工智能、大數據和云計算”三位一體的發(fā)展戰略。為什么谷歌和百度都在人工智能領(lǐng)域重金發(fā)力?2015年百度投入研發(fā)創(chuàng )新的資金占公司總營(yíng)收的16%。谷歌就不用說(shuō)了,在量子計算這樣離實(shí)現還遙不可及的技術(shù)上都已經(jīng)投入很多研發(fā)資金。因為互聯(lián)網(wǎng)未來(lái)向智能+發(fā)展的基礎是數據。有數,有趨向完整的海量數據是現在所有巨頭在布局人工智能+大數據生態(tài)模式的重點(diǎn)。
大數據服務(wù)還是那個(gè)大數據服務(wù)嗎?-數據分析網(wǎng) 數據獲取的最新模式:眾包
眾包是一種整合資源提升效率的方式,通過(guò)眾包可以在集合海量數據中,篩選符合一定標準的有效數據,能夠降低數據收集的成本,提高機器學(xué)習訓練的效率。有個(gè)生物學(xué)家叫戴維•休斯(David Hughes),他和作物流行病學(xué)家馬塞爾•薩拉斯(Marcel Salathé)將機器視覺(jué)技術(shù)和深度學(xué)習算法應用于農業(yè)病蟲(chóng)害智能防治上。他們將關(guān)于植物葉子的5萬(wàn)多張照片導入計算機,并運行相應的深度學(xué)習算法,針對在明亮的光線(xiàn)條件及合乎標準的背景下拍攝出植物的照片,最終程序正確識別率高達99.35%。如果在互聯(lián)網(wǎng)上隨機選取的植物葉子照片,其識別準確率將降至30%-40%,這也是目前視覺(jué)識別技術(shù)在復雜環(huán)境下尚未突破的地方。為了突破算法的限制,提高準確率,休斯和薩拉斯開(kāi)發(fā)手機應用Plant Village,讓世界各地的農民通過(guò)Plant Village上傳患病作物照片,其中包含照片如何拍攝、拍攝地點(diǎn)、年份等大量數據,并包含農業(yè)專(zhuān)家對此做出相應診斷的信息。這種方式出現之后,數據獲取的難度依舊聚焦在多維度數據資源的聚合,眾包可以解決從分散的個(gè)體獲取目標數據的問(wèn)題,但對于基礎數據資源層的擴張和占領(lǐng)依然是一場(chǎng)沒(méi)有硝煙的砸錢(qián)戰斗。
數多了怎么辦:智能計算
有些人在努力獲取數據,有些人在為數據多而未能充分利用而焦慮。
數據量級達到一定程度,再利用數據優(yōu)化服務(wù)需要人工智能算法。隨著(zhù)企業(yè)數據量的積累,挖掘數據提高效率變成了必需。比如商業(yè)應用中打車(chē)平臺的應用,國內平臺滴滴與快滴合并之后,業(yè)務(wù)線(xiàn)從出租車(chē)擴張到專(zhuān)車(chē)、順風(fēng)車(chē)、公交等領(lǐng)域,數據范圍猛增,數據量包含司機行為數據、顧客行為數據及各種路線(xiàn)數據、實(shí)時(shí)交通情況數據,定位數據等,據滴滴官方公布,滴滴出行每天處理的數據量達到70TB,由于訂單處理響應時(shí)間的要求,單純處理數據的效率已無(wú)法滿(mǎn)足實(shí)時(shí)服務(wù)的需求,必須借助人工智能算法才能夠進(jìn)一步提升服務(wù)效果。從用戶(hù)體驗角度,也需要實(shí)現提升定位精準度,提高接單率,縮短應答時(shí)間。目前滴滴內部基于海量數據+機器學(xué)習算法的推薦匹配系統,針對海量司機的交班時(shí)間、地點(diǎn)、接單/拒單情況等海量數據進(jìn)行司機畫(huà)像,以此為基礎,針對實(shí)時(shí)的訂單數據,分配訂單時(shí)實(shí)時(shí)按需分配,滿(mǎn)足服務(wù)需求。從數據應用展現更宏觀(guān)價(jià)值的角度來(lái)看,基于滴滴已有數據,可整合實(shí)時(shí)交通情況數據,包括擁堵路段、集中路線(xiàn)、集中商圈等多維度動(dòng)態(tài)數據,進(jìn)行結構化處理,達到整合一個(gè)城市的車(chē)輛分布,實(shí)現統籌平衡調度的目的。
大數據服務(wù)的現在及未來(lái):智能+生態(tài)模式
未來(lái)人工智能+大數據生態(tài)模式將更多的應用于在商業(yè)場(chǎng)景下。我們認為,大數據服務(wù)未來(lái)將有以下四種模式:
一是形成數據資源和計算資源提供平臺。當前企業(yè)數據大多僅留存于企業(yè)內部,在開(kāi)發(fā)應用上一般也只有內部應用,企業(yè)之間數據各自孤立,獨立計算,行業(yè)內尚未形成整合大數據,目前第三方數據采集、監測機構已經(jīng)開(kāi)始致力于多維數據的采集服務(wù),包括外部數據的直接采集和企業(yè)內部數據的間接采集,已有第三方在提供基礎數據庫資源。未來(lái)伴隨數據維度的豐富和數據量的擴大,第三方機構將采集并使用智能算法結構化處理形成相對完整的數據資源提供平臺,并針對些海量數據的存儲、整合及計算提供基于云端的平臺式服務(wù)。
二是出現技術(shù)服務(wù)平臺,包含提供Paas服務(wù)的開(kāi)源平臺及計算能力、大數據解決方案及技術(shù)服務(wù)支持。從目前人工智能和大數據企業(yè)發(fā)展來(lái)看,只有巨頭和少數創(chuàng )業(yè)企業(yè)掌握核心算法及存儲真正大數據,更多企業(yè)通過(guò)合作或建立產(chǎn)業(yè)聯(lián)盟的方式獲取行業(yè)或其他領(lǐng)域的數據。但對于數據的存儲、處理和應用需要技術(shù)支撐且突破這些技術(shù)需要消耗大量人力物力財力,沒(méi)必要所有企業(yè)都去做這件事。PaaS服務(wù)將數據處理能力作為模塊開(kāi)放出來(lái),使得數據挖掘技術(shù)的使用門(mén)檻和成本大幅降低,更多企業(yè)有能力利用云端數據服務(wù)創(chuàng )造附加價(jià)值。因此形成Paas服務(wù)平臺或解決方案技術(shù)服務(wù)平臺,據此可以聚合數據資源,優(yōu)化算法,提高準確率。另外也會(huì )形成基于數據存儲、處理及挖掘技術(shù)的整體服務(wù)解決方案提供商,企業(yè)可以將數據服務(wù)完全外包給第三方機構,第三方機構也可以通過(guò)這種方式在云端整合資源并優(yōu)化技術(shù),提高準確率,同時(shí)產(chǎn)生推動(dòng)行業(yè)發(fā)展的效果。
三是出現資訊服務(wù)平臺。大數據產(chǎn)業(yè)相對仍是新興產(chǎn)業(yè),發(fā)展日新月異。一方面企業(yè)需要尋找大數據資源或技術(shù)服務(wù)平臺,另外一方面第三方服務(wù)機構需要推廣宣傳自身及行業(yè)發(fā)展、技術(shù)發(fā)展現狀。在這種背景下將出現起到橋梁作用的專(zhuān)業(yè)資訊服務(wù)平臺,連接企業(yè)和第三方服務(wù)機構,同時(shí)起到發(fā)布整個(gè)行業(yè)前沿信息的作用。
四是出現交叉/垂直化服務(wù)應用?,F階段在教育、金融領(lǐng)域的垂直應用以及在未來(lái)智能營(yíng)銷(xiāo)、智能制造等交叉行業(yè)的應用。如在教育行業(yè)已出現利用積累的教、考、學(xué)環(huán)節的大數據結合深度學(xué)習算法推出個(gè)性化學(xué)習平臺,如國外的Knewton、國內的智學(xué)網(wǎng)都是這種模式。未來(lái)將延伸至農業(yè)、制造業(yè)、交通、醫療等各行各業(yè),出現如智能農業(yè)生產(chǎn)管理、智能交通、個(gè)性化精準醫療等創(chuàng )新服務(wù)。
推薦新聞
- 1一圖讀懂丨5G的“前世今生”
- 2中國電子技術(shù)標準化研究院院長(cháng)趙新華:深化“軟件定義” 推動(dòng)軟件
- 3【聚焦】重慶首次發(fā)布軟件產(chǎn)業(yè)發(fā)展報告 到2025年年收入將達5000
- 4工業(yè)和信息化部印發(fā)“十四五”大數據產(chǎn)業(yè)發(fā)展規劃
- 5工業(yè)和信息化部印發(fā)“十四五”軟件和信息技術(shù)服務(wù)業(yè)發(fā)展規劃
- 6恭喜,重慶首批10家單位通過(guò)軟件服務(wù)商交付能力評估
- 7仙桃數據谷被認定為2021年市級樓宇產(chǎn)業(yè)園
- 8大數據的應用場(chǎng)景及實(shí)際可落地性問(wèn)題
- 9應用數據挖掘進(jìn)行客戶(hù)關(guān)系管理
- 10解讀一個(gè)新IBM的平臺戰略:云、大數據分析與人工智能