亚洲日本va中文字幕在线不卡_亚洲在线小视频_国产成人在线电影_高清在线一区二区

| 加入桌面 | 手機版
免費發布信息網站
貿易服務免費平臺
 
 
當前位置: 貿易谷 » 資訊 » 電子商務 » 用大數據預測世界杯:狂熱預測打了臉

用大數據預測世界杯:狂熱預測打了臉

放大字體  縮小字體 發布日期:2014-07-15 09:56  來源:虎嗅網   瀏覽次數:40
  世界杯的狂歡結束,還在天臺上的球迷們,可以下樓睡覺了。狂歡之余,大家對世界杯的熱情讓比賽結果具有了商業價值,更促使了機構們熱衷對比賽的預測。比起上屆的章魚保羅,機構們的預測背靠大數據資源和技術,預測起來都更有底氣。但是他們的預測是不是真的算得上大數據?它們具體又是怎么操作的呢?
  1.百度:高考作文跟世界杯不一樣哦!
  百度預測今年精準預測了五一的景點爆滿情況和部分高考作文題,當然不會放過世界杯這個機構們測試大數據能力的舞臺。制約大數據的一大問題就是海量的數據,搜索巨頭百度在這一點上擁有先天的優勢。
  百度北京大數據實驗室的負責人張桐(Zhang Tong)介紹稱,
?   在百度對世界杯的預測中,我們一共考慮了團隊實力、主場優勢、最近表現、世界杯整體表現和博彩公司的賠率等五個因素。
  百度大數據部利用大數據搜索過去5年內全世界987支球隊的3.7萬場比賽數據,共涉及到19972名球員和1.12億條相關數據,這些數據的來源基本都是互聯網,再利用一個由搜索專家設計的機器學習模型來對這些數據進行匯總和分析,進而做出預測結果。
?  針對本屆世界杯的16場淘汰賽的預測,準確度達到了100%。而今年頻頻爆冷的小組賽階段,百度對比賽結果的預測準確率也達到了58.33%,這一結果高于微軟語音助手Cortana和必應搜索聯合得出的56.25%的準確率。但是100%的準確度也只是猜勝負,德國和巴西7:1的結果就和百度預測的,德國將會以微弱的優勢贏下巴西(51%對49%),二者相去甚遠。
? ?  其實百度在世界杯開賽前預測的冠軍是巴西,我會說?
  2.微軟:小冰、Cortana、必應家小齊上陣
?   微軟公司對世界杯的預測除了以往比賽歷史外,考慮了更多的因素:地理位置、草坪、天氣、大量預測的參考(群體智慧),還使用大量的公開數據——博彩市場、民意調查、社交媒體以及其它在線數據,通過歐洲賠率市場最有名的指數Betfair(必發指數)來構建預測模型,并通過微軟的個人語音助手Cortana和必用搜索引擎發布。微軟的分析似乎更有大數據的氣質,相較之百度的參考因素更像依靠經典理論的傳統統計分析。
  基于微軟的分析,WP8.1 Cortana預測巴西世界杯的戰果是15勝1敗。微軟表示,Cortana進行預測會綜合考慮主場優勢,這也是為何在預測巴西對決荷蘭的季軍爭奪戰中認為巴西會取勝的一個因素。
  這次世界杯15勝1敗的戰果是,就上一場比賽結果對下場比賽的預測。而早在2013年12月,微軟研究院就“高瞻遠矚”,聲稱開發了一款Excel軟件,用大數據來預測2014年世界杯。預測結果是:巴西將奪冠,奪冠率達到22.5%,遠遠高于其他對手,如今似乎沒人拿出來打臉了。
  3.谷歌:關鍵時刻掉鏈子?
  谷歌從Opta Sports的數據中,分析了職業足球聯盟、世界杯小組賽中隊員們的表現,引入了由BigQuery工程師喬丹·提加尼開發的實力排行榜系統,來推測他們將會在本屆世界杯有什么樣的表現。此外,還考慮了觀眾熱情程度的數據,來計算主隊優勢。
? ?   谷歌則預測了16進8和8進4的兩輪比賽,而谷歌在12場預測中有11場正確,準確率為91.67%,預測八強賽時,對關鍵的德法大戰預測錯了。
? ?  在大數據概念的推廣過程中,對流感等疾病的大數據預測一直是傳播的范本,但是,2013年谷歌對于流感的預測與美國疾病控制中心匯總后的結果相比,就夸大了幾乎一倍。大數據預測的準確性,仍然是一個需要長時間研究的課題。
  4.高盛:傳統模型寶刀已老
?  擁有世界最頂尖的經濟學家的高盛,通過對自1960年以來的正式國際14000場足球比賽數據的回歸分析來構建預測模型,還通過泊松模型分析了每場小組賽的比分情況。其思路完全是傳統的統計分析,并沒有體現大數據的總體樣本的特點。模型和算法也遵從了投資公司善用的經典模型,并沒有完全根據本次世界杯的命題來答題。
  高盛在小組賽預測的準確率為37.5%,并在世界杯開始前,預測東道主巴西最有可能斬獲世界杯冠軍,奪冠幾率為48.5%,比任何參賽球隊高3倍。甚至給出了最終決賽的結果,巴西將以3比1的比分,戰勝最后的宿敵阿根廷。即使大數據還不夠成熟,但是傳統的樣本分析在大數據結果面前還是相形見絀的。
  5.雅虎:當機器被情緒誤導
  雅虎科學家小組基于,Tumblr上所有有關世界杯的討論都存在有價值的信息,利用了輕博客網站Tumblr的數據來估計每支國家隊的優勢。雅虎科研小組表示他們從831億篇Tumblr博客中篩選了1.889億篇文章用于分析,自2月至5月,他們將注意力集中于2730萬篇與世界杯“相關博文”。針對每一次比賽,雅虎會利用名為泊松分布不同參數的概率論來估計每一支隊伍可能的進球數量,例如在“與世界杯有關的帖子里被提及的國家隊”。
  雅虎預測德國將打敗葡萄牙,而西班牙將擊敗荷蘭,而最后的冠軍是巴西。可憐被雅虎提到的兩只會獲勝的隊伍,西班牙和巴西都已恥辱性的比分被打敗。據說社交網絡數據可以預測傳染病和犯罪現場,這是因為傳染病和犯罪現場中可以利用社交網絡發布內容的客觀成分,而且大量分散的信息組織起來形成了意義。但雅虎把它用到預測足球比賽上,顯然被網友們的情緒誤導了。
  6.德國科隆體育學院:專業范兒試刀
  據科隆體育學院官網稱,該校格羅爾教授領導的研究小組用他們設計的計算機模擬算式對本屆2014年世界杯可能的結果進行了共10萬次測算,考慮因素不僅包括各隊的世界排名、足彩賠率、市值、預選賽表現,還包括可能的傷病、戰術、氣候條件、主場優勢因素等。
  德國科隆體育學院的研究人員在世界杯開賽前,就拋出了預測結果:預測認為德國、巴西、哥倫比亞、阿根廷、比利時和荷蘭6支隊肯定能打入八強,西班牙即使殺出小組賽也會在八分之一決賽中被巴西淘汰。其后巴西、德國、阿根廷和荷蘭半決賽,最終將由巴西和阿根廷爭冠,巴西奪冠概率20.4%,阿根廷14.7%。現在看來,除了決賽,其他預測得都還挺準。
?  7.德意志銀行:敢和寵物比精準
  據英國《衛報》網站6月9日報道,德意志銀行預測,英格蘭隊將在巴西世界杯中奪冠。德銀建立了量化分析模型,計算參數包含球隊的世界排名、以往戰績、球員構成和賭球市場賠率。得出的奪冠概率是巴西名列第一,緊隨其后的是德國、西班牙、法國。但是,德銀表示這樣的預測太乏味也太傳統,于是德銀引入了一系列條件,最后得出了英格蘭是冠軍的結果。他們的理由是,上一次英格蘭奪冠時,隊中就有很多利物浦球員,和這次情況一致,因此他們確信英格蘭隊將在巴西奪冠。
  無獨有偶,英國最大的寵物連鎖店“家中寵物(Pets at Home)”,讓一只名叫Roo的會通靈的斗牛犬來預測,結果它預測英格蘭會在決賽中擊敗意大利奪冠。
  他們得出了相同的結論,還真是可愛。
  8.數據新聞網站FiveThirtyEight:巴西粉
  天才數據分析師內特·西爾弗(Nate Silver),曾經在2012年美國總統大選中準確預測了50個州的選舉結果,為了預測棒球選手的成績而開發了統計工具PECOTA,新創辦了一個使用統計數據來分析所有現象的新聞網站FiveThirtyEight。
  不過,專門從事比賽結果預測的平臺,也沒有在世界杯的預測中保住節操。FiveThirtyEight預測巴西能擊敗德國,并在決賽中捧杯。
  決賽結束后,黃健翔在微博上轉了他4月做出的預測,巴西、阿根廷、德國、意大利、法國、荷蘭、英格蘭各隊命運全都說中。大數據在世界杯期間的狂歡也不能代表其成熟,或許在足球領域還比不上專業人士的經驗分析。
  回想世界杯開賽前,機構發布的預測結果大多是巴西大熱門,西班牙有希望等論調。而百度、微軟準確率近乎100%的預測,都是在基于上一場比賽結果的基礎上預測下一場。大數據的策略是發現,以及猜測、印證的循環逼近過程,一般只會設定一個大方向,算法模型都可能在執行的過程中做大幅度調整。這才有了他們在賽前預測巴西,賽中算準德國的兩種預測。
  大數據時代分析的瓶頸不再是算法和存儲,而是接近于總體的海量信息,以及如何與具體的命題相結合的模型建構。在巨頭林立的今天,對于普通人海量信息首先是無法逾越的門檻,但是這正是大型網絡公司們的優勢。特別是這次預測變現優秀的百度、必應和谷歌這類的搜索引擎,而百度也專門創立百度預測,以期更多得干預到日常生活。
  人們一直想找到如何能更準確認識世界的方法,從樣本統計到大數據運算,大家都談在概念,卻鮮有人能將其與真正的商業、生活結合,產生有意義的結果。對于正在玩大數據概念的互聯網公司而言,具體到怎樣建立有效模型,提高計算結果的準確性,還在摸著石頭過河。
分享與收藏:  資訊搜索  告訴好友  關閉窗口  打印本文 本文關鍵字:
 
推薦圖文
贊助商鏈接
推薦資訊
贊助商鏈接
 
站內信(0)     新對話(0)