馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗

科技評(píng)論202閱讀模式

王者榮耀,順利成為全場(chǎng)焦點(diǎn)。

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片1

這不是你以為的KPL(王者榮耀職業(yè)聯(lián)賽)現(xiàn)場(chǎng)。

而是企業(yè)云集的上海世界人工智能大會(huì)(WAIC 2021)的一角。

人類 VS 絕悟(AI),2萬(wàn)元現(xiàn)金+2萬(wàn)Q幣獎(jiǎng)勵(lì)。

成功激發(fā)了在場(chǎng)所有人的熱情。

甚至在場(chǎng)外,肉身缺席的PonyMa,“臨門一腳”地發(fā)來(lái)語(yǔ)音,專門宣布這件事。

重視程度,可見(jiàn)一斑。

于是,這件事也順利登上了各大榜的熱門話題。

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片2

接下來(lái),一同來(lái)看下這場(chǎng)人機(jī)大戰(zhàn)。

面對(duì)AI,人類不能輸!

5位挑戰(zhàn)者上臺(tái)坐定,隨著主持人一聲令下,比賽正式開(kāi)始。

禁英雄(Ban)階段,AI的動(dòng)作就有說(shuō)道——次次禁蒙恬。

至于為什么,現(xiàn)場(chǎng)工作人員解釋道:

AI根本不Care人頭,上來(lái)就快速推塔帶線,這都是跟職業(yè)隊(duì)練出來(lái)的。

蒙恬這種英雄4級(jí)后爆發(fā)推塔很強(qiáng),甚至一打五都可能。

嘿,別看只是個(gè)AI,戰(zhàn)術(shù)還玩得挺溜。

最終陣容如下:

人類:耀、魯班、婉兒、韓信和大喬。

絕悟:孫尚香、達(dá)摩、牛魔王、雅典娜和奕星。

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片3

OK,大戰(zhàn)開(kāi)始!

開(kāi)局原本各自對(duì)線好好發(fā)育,絕悟糾集4個(gè)英雄想來(lái)滅掉中路大喬和耀也沒(méi)得逞。

但等到2分鐘打龍時(shí),絕悟分別在兩個(gè)龍區(qū)拿到2個(gè)人頭。

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片4

下一分鐘,絕悟又在下路糾集4打2拿到2人頭,一下就把差距拉到4:0,還拆了一個(gè)塔。

就此人類崩了,等到跑車出擊時(shí)差距已經(jīng)拉到7:0。

到最后,絕悟5個(gè)英雄甚至越高地塔進(jìn)去瘋狂輸出人類,3:16,直接被推……

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片5

啪的一下,就很快有木有!

隨著戰(zhàn)斗結(jié)束,主持人凡爾賽般安慰選手:

希望大家不要有心理負(fù)擔(dān),享受游戲快樂(lè)最重要。

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片6

被虐的不止是路人

但我們一同回看下AI的操作。

毫無(wú)破綻就不說(shuō)了,配合度和精準(zhǔn)度都高很多。

比如越塔殺人:

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片7

進(jìn)入水晶區(qū)火中取栗:

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片8

還懂得當(dāng)退就退,絕不戀戰(zhàn):

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片9

當(dāng)然AI也有犯傻時(shí)候,殘血還在踟躕:

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片10

于是,就著AI這種“騷操作”,參與比賽的現(xiàn)場(chǎng)觀眾沒(méi)能勝AI一場(chǎng)。

絕大部分戰(zhàn)斗甚至沒(méi)有推掉一個(gè)塔。

因此,一人三殺、團(tuán)隊(duì)十殺均能獲得獎(jiǎng)勵(lì),雖然只有Q幣,沒(méi)有現(xiàn)金。

雖說(shuō)絕悟?qū)嵲趶?qiáng),不過(guò),人類不服輸?shù)囊庵臼潜粡氐滋魟?dòng)起來(lái)的!

連主持人都忍不住了:

每次Ban人時(shí)勸誡大家不要選操作太難的英雄,挑自己擅長(zhǎng)的來(lái)。

絕悟會(huì)Ban元歌和露娜,這兩個(gè)英雄有會(huì)玩的選手可以優(yōu)先選。

也正因大家都明白對(duì)戰(zhàn)不易,每次人類方首殺AI總能獲得喝彩,有一位哪吒反復(fù)擊殺AI,更是贏得滿堂鼓掌:

好!!!

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片11

我們大致算了一下,開(kāi)展2天大約有15波參賽隊(duì)組團(tuán)挑戰(zhàn)。

較好組合一局內(nèi)憑借操作加上依托己方塔打防守反擊,勉強(qiáng)在人頭數(shù)上與AI差距不大。

但,也僅止步于人頭數(shù)差距不大——

而這,還是官方將AI戰(zhàn)力調(diào)低過(guò)的…

或許你會(huì)說(shuō),前來(lái)挑戰(zhàn)的都是路人才會(huì)如此。

不不不。

還真不是如此。

絕悟在現(xiàn)場(chǎng)也同職業(yè)選手大戰(zhàn)4個(gè)回合。

這些選手ID分別為重慶 QGhappy.Hurt、成都 AG 超玩會(huì)。無(wú)痕、武漢 eStarPro. 諾言、深圳 DYG. 小義以及辰鬼。

最終,他們與絕悟比分3:1,仍然是AI勝。

不過(guò)一位現(xiàn)場(chǎng)工作人員向量子位爆料:

并不是真的AI多厲害,而是人類選手缺乏配合上的磨合,直接上來(lái)打表演賽,倘若按專業(yè)電競(jìng)比賽集訓(xùn)磨合再與AI對(duì)戰(zhàn),勝負(fù)尚未可知。

而關(guān)于絕悟唯一那次失敗,量子位專門向其詢問(wèn)感受,對(duì)方表示:

這都正常…

口氣云淡風(fēng)輕。

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片12

絕悟背后的騷技術(shù)

絕悟碾壓人類的技術(shù)是什么?

根據(jù)騰訊官方說(shuō)法,絕悟并沒(méi)有所謂“開(kāi)掛”,在游戲中的客觀條件限制是一致的。

“絕悟”區(qū)別于人的優(yōu)點(diǎn)主要有兩點(diǎn):

首先,訓(xùn)練效率非常高,一天的訓(xùn)練強(qiáng)度高達(dá)人類 440 年(腱鞘炎警告);

其次,不受情緒、性格影響,配合障礙更低。

用一句話概括就是,比你理性,不被情緒左右,沒(méi)有那種世俗欲望,還比你勤奮。

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片13

絕悟之所以要如此勤奮,也是被王者榮耀逼的——這游戲太難了。

首先,作為是一個(gè)無(wú)法預(yù)料對(duì)方操作的不完全信息游戲,玩家需要不斷探視野,敵我雙方的實(shí)時(shí)位置、狀態(tài)等信息不透明,AI也需要在這樣的前提下做決策;

其次,王者榮耀對(duì)局復(fù)雜。

100多個(gè)英雄,這其中的陣容組合高達(dá)10的15次方種,不同的組合對(duì)應(yīng)的打法又不一樣。

另一方面,游戲中的角色狀態(tài)、種種操作加上裝備選擇相當(dāng)復(fù)雜。

光是想想已經(jīng)頭大,還要在策略規(guī)劃、目標(biāo)選擇、技能應(yīng)用、路徑探索及團(tuán)隊(duì)協(xié)作上面臨大量、不間斷、即時(shí)的選擇。

我們也向現(xiàn)場(chǎng)技術(shù)人員做了請(qǐng)教:絕悟AI與谷歌ALPHAGO能力是否雷同?

對(duì)方表示:

絕悟算力水平遠(yuǎn)超ALPHAGO,因?yàn)閲逵螒虮澈蟮目赡苄赃h(yuǎn)少于王者。

后者除操作英雄,還有協(xié)同打團(tuán),BAN人及不同英雄配合需要考慮進(jìn)去,所需算力不在一個(gè)量級(jí)。

工作人員還透露了一個(gè)驚人的數(shù)字:

AI在一局里操作可能性大概有10的2萬(wàn)次方種。

什么概念?

整個(gè)宇宙原子總數(shù)也只是10的80次方!

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片14

如此復(fù)雜情景對(duì)絕悟背后的AI技術(shù)要求極高。

最初版本的“絕悟”通過(guò)監(jiān)督學(xué)習(xí)方法來(lái)訓(xùn)練,以海量有標(biāo)記的訓(xùn)練數(shù)據(jù)為基礎(chǔ),推導(dǎo)出行為預(yù)測(cè)函數(shù),實(shí)現(xiàn)擬人化。也因此,標(biāo)注數(shù)據(jù)質(zhì)量尤為重要。

隨著研發(fā)團(tuán)隊(duì)在深度強(qiáng)化學(xué)習(xí)、多智能體決策課題上的研究不斷深入,“絕悟”不再需要模仿人類數(shù)據(jù),轉(zhuǎn)而通過(guò)與自己對(duì)戰(zhàn),進(jìn)一步提升微操水平和大局觀,達(dá)到了王者榮耀職業(yè)電競(jìng)水平。

強(qiáng)化學(xué)習(xí)通過(guò)構(gòu)建獎(jiǎng)勵(lì)和懲罰刺激環(huán)境的角度出發(fā),優(yōu)化AI行為邏輯。

根據(jù)團(tuán)隊(duì)技術(shù)負(fù)責(zé)人楊光介紹:

AI會(huì)通過(guò)獎(jiǎng)勵(lì)(reward)反饋,知道一個(gè)行為做的好還是不好。在獲得大量反饋后,AI會(huì)漸漸摸索出能夠取得勝利的行為,表現(xiàn)出‘學(xué)會(huì)’玩游戲的效果。

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片15

這個(gè)方法的優(yōu)點(diǎn)在于,不依賴已有數(shù)據(jù)并且能夠探索出新的策略,甚至于超越當(dāng)前人類的認(rèn)知,在行為多樣性和完成任務(wù)的能力方面有了質(zhì)的提升。

比如在訓(xùn)練后期,AI 甚至自己探索出了全新策略,“比如‘絕悟’經(jīng)常多人抱團(tuán)吃線,從而達(dá)到經(jīng)濟(jì)的最大化”。

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片16

上述技術(shù)相關(guān)論文早在2018年已經(jīng)公布。

今年5月,絕悟也已在線上與很多玩家開(kāi)啟對(duì)戰(zhàn),各家媒體跟進(jìn)宣傳。

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片17

論及絕悟又有什么新變化?

現(xiàn)場(chǎng)工作人員向量子位獨(dú)家透露,今年5月至今,絕悟采用了更多訓(xùn)練KPL職業(yè)選擇操作數(shù)據(jù)進(jìn)行訓(xùn)練。

另一方面,騰訊AI Lab長(zhǎng)期保持與頂尖高效合作,通過(guò)貢獻(xiàn)技術(shù)數(shù)據(jù),高校相應(yīng)成果與技術(shù)也參與其中,由此,“絕悟”水平也達(dá)到了今天頂尖選手層次。

馬化騰的2萬(wàn)不好賺!絕悟AI穩(wěn)如猛虎 人類王者被虐成狗-圖片18

看完對(duì)陣AI現(xiàn)場(chǎng)及技術(shù),不瞞你說(shuō),我這個(gè)鉑金段位自己也一個(gè)沒(méi)忍住報(bào)名1V1。

由于只能選限定的部分英雄,日常張飛劉禪的我,也不得已選了關(guān)羽。

于是乎,被虐了個(gè)5:1,而那1殺是塔點(diǎn)掉的……

經(jīng)歷完這些,我已卸載王者,告別一場(chǎng)賺2萬(wàn)的幻想,安心工作去了……

 
  • 本文由 米粒 發(fā)表于 2021年7月11日23:06:33
  • 轉(zhuǎn)載請(qǐng)務(wù)必保留本文鏈接:http://www.bjmhhq.com/97108.html
科技

毒性堪比眼鏡蛇 亂摸水母會(huì)出人命!

抖音之前很流行的“水母手勢(shì)舞”你會(huì)嗎?張開(kāi)手掌再捏住手指向后拉,收回手指,張開(kāi)手指,你就可以得到一只簡(jiǎn)略版的水母~ 然而不是所有的水母都這般可愛(ài)無(wú)害,比如今天的主角&mdash...

發(fā)表評(píng)論

匿名網(wǎng)友
:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:
確定

拖動(dòng)滑塊以完成驗(yàn)證