近年來(lái),人工智能(AI)技術(shù)發(fā)展迅猛,并被快速推動(dòng)應用到社會(huì )生活的各個(gè)方面,智能博弈領(lǐng)域正是其應用與實(shí)踐的熱點(diǎn)領(lǐng)域之一。2019年12月28日,第三屆全國兵棋推演大賽人機挑戰賽暨首屆全國智能博弈論壇在火熱的氛圍中落下帷幕,來(lái)自軍地科研院所、院校、國防軍工企業(yè)和智能博弈領(lǐng)域的260余位專(zhuān)家、學(xué)者觀(guān)摩了比賽盛況并參加了論壇交流。
所謂“人機挑戰賽”,即人類(lèi)選手與AI智能體的對戰。本次挑戰賽的兵棋AI智能體——“戰顱”由國防科技大學(xué)系統工程學(xué)院研制;參加挑戰的人類(lèi)選手是通過(guò)全國兵棋推演大賽總決賽篩選出的11名優(yōu)秀選手。比賽吸引了眾多與會(huì )人員的關(guān)注,大家帶著(zhù)強烈的好奇心爭相目睹“人與人工智能”的精彩對決。
比賽當日,國內眾多智能博弈與兵棋領(lǐng)域的專(zhuān)家蒞臨現場(chǎng)觀(guān)摩,中國指揮與控制學(xué)會(huì )監事長(cháng)、中國工程院戴浩院士等嘉賓現場(chǎng)觀(guān)摩了比賽并致辭。比賽開(kāi)幕式由中國指揮與控制學(xué)會(huì )理事劉忠教授主持。全國兵棋推演大賽總導演兼總裁判長(cháng)楊南征、“戰顱”首席設計師馮旸赫、優(yōu)秀參賽選手代表呂峒臻作為點(diǎn)評嘉賓,對現場(chǎng)比賽進(jìn)行了精彩講解和點(diǎn)評。
比賽開(kāi)始前,大賽總導演兼總裁判長(cháng)楊南征介紹說(shuō),“戰顱”在賽前已經(jīng)與全國兵棋推演大賽總決賽前48名的選手對戰了36場(chǎng),目前保持全勝。本次人機對抗賽特別邀請了獲得全國賽特等獎、一等獎、二等獎的11名優(yōu)秀選手分別挑戰智能體,將為我們帶來(lái)22場(chǎng)精彩對決。對于比賽結果,他更希望人類(lèi)選手能夠挑戰成功。
經(jīng)過(guò)1個(gè)半小時(shí)的緊張角逐,“戰顱”以全勝戰績(jì)贏(yíng)得了冠軍。馮旸赫表示,“戰顱”的研發(fā)基于智能系統工程思想,融合知識推理、監督學(xué)習、半監督學(xué)習、集成學(xué)習和強化學(xué)習等一系列方法構建智能決策模型,充分利用人人對抗產(chǎn)生的優(yōu)質(zhì)數據和機機自打產(chǎn)生的大數據對智能體進(jìn)行訓練。截止參賽,“戰顱”一共訓練了136天,每天一個(gè)計算節點(diǎn)大約自打160盤(pán)。據悉,“戰顱”的主創(chuàng )人員是國防科大一群平均年齡僅24歲的碩士生博士生,該智能體是他們集中攻關(guān)4個(gè)多月的智慧結晶。
中國指揮與控制學(xué)會(huì )智能博弈與兵棋推演專(zhuān)委會(huì )主任委員黃金才教授表示,從近一個(gè)月的參賽表現看,智能體不僅學(xué)會(huì )了一些人類(lèi)選手的經(jīng)典戰法,還獨創(chuàng )了部分特有的戰法戰術(shù)。當然,從比賽中也可以看出“戰顱”目前還存在很多局限性,這次戰勝人類(lèi)選手也只是智能博弈技術(shù)在實(shí)踐應用中邁出的第一步,他表示,將帶領(lǐng)研發(fā)團隊進(jìn)一步探索智能博弈的“無(wú)人區”,構建具有持續學(xué)習能力的智能體。
在11位人類(lèi)挑戰者中,來(lái)自軍地院校的王俊翔、武煜強、余雷脫穎而出,成為人類(lèi)選手的“前三甲”。三位選手在賽后采訪(fǎng)時(shí)表示,“戰顱”的優(yōu)點(diǎn)是數據分析、學(xué)習能力強,能針對人類(lèi)選手的操作、根據實(shí)時(shí)態(tài)勢改變應對策略,擅長(cháng)精算、細算;而人類(lèi)選手可以通過(guò)奇策奇招,針對“戰顱”的策略漏洞進(jìn)行針對性打擊。
針對此次大賽的結果,劉忠教授表示,AI的獲勝并不代表人工智能技術(shù)在任務(wù)規劃領(lǐng)域超越了人類(lèi),AI智能體是在人類(lèi)智慧的基礎上研發(fā)出來(lái)的,特別是在智能博弈領(lǐng)域,人工智能的學(xué)習效率及泛化性還有待提高,針對智能指揮與控制,要推動(dòng)智能博弈技術(shù)從實(shí)驗室走向實(shí)踐應用,仍需砥礪前行。
在下午舉辦的首屆全國智能博弈論壇上,來(lái)自兵棋推演、智能指控、機器學(xué)習等領(lǐng)域的四位專(zhuān)家分別圍繞“兵棋推演的前世今生”、“智能指揮控制的實(shí)踐與思考”、“多智能體強化學(xué)習中的博弈與均衡”、“面向星際爭霸的大規模智能體訓練技術(shù)”等四個(gè)主題做了精彩報告,為現場(chǎng)觀(guān)眾帶來(lái)了一場(chǎng)智能博弈與兵棋推演的“學(xué)術(shù)盛宴”。
本次人機挑戰賽作為中國指揮與控制學(xué)會(huì )主辦的2019第三屆全國兵棋推演大賽的一項專(zhuān)題賽事,由國防科技大學(xué)系統工程學(xué)院和CICC智能博弈與兵棋推演專(zhuān)業(yè)委員會(huì )協(xié)辦,活動(dòng)得到了中國電科五十二研究所、北京華戍防務(wù)技術(shù)有限公司等單位的大力支持。隨著(zhù)AlphaGo、AlphaStAR等不斷攻破人類(lèi)智能高地,人工智能發(fā)展將對各行各業(yè)產(chǎn)生沖擊甚至顛覆性影響。本次“人機挑戰賽”作為探索智能博弈新方法、國防教育新模式的有效手段和載體,必將對人工智能技術(shù)的實(shí)踐應用產(chǎn)生重要影響。
供稿:程光權、吳克宇
圖片:何書(shū)遠、劉世旋
編輯:楊勇、劉亞麗