2016 五月號
標頭

第126期電子報  出刊日期:1050509


科學新文摘

 

人工智慧下出罕見妙手

從蒙地卡羅樹搜尋演算法到深度神經網路,層層剖析AlphaGo如何在圍棋比賽中出奇制勝。

撰文/葉平


今年3月DeepMind公司的AlphaGo圍棋程式和多次世界冠軍南韓職業棋士李世?九段的五局大戰,牽動了全球圍棋界和科技界的神經,筆者接觸電腦圍棋超過20年,自然不會錯過每局比賽的現場直播。2016年3月12日無疑會在科技史上留名,這一天AlphaGo取得第三勝,確定擊敗李世?。五戰結束後,AlphaGo以4:1的成績獲勝。許多職業棋士說,AlphaGo下得很像人,如果只看棋譜,看不出AlphaGo持黑還持白。或許我們可以說AlphaGo在圍棋上通過了涂林測試,值得冠上人工智慧之名。

AlphaGo的致勝關鍵

AlphaGo的大架構仍然是MCTS,成功的關鍵是引進策略網路與估值網路兩個深度神經網路,大大提高MCTS的效能:策略網路減少需要考慮的落點,估值網路減少需要模擬的手數,結合起來,就能在更短的時間找到更佳的著手。而DeepMind團隊用了三個階段,來訓練這兩種網路。

第一階段是模仿,術語是監督式學習。DeepMind團隊用KGS圍棋伺服器上的3000萬盤棋來訓練策略網路,讓它在給定一個盤面時算出下一手人類會下在各個著點的機率。假設某個角落的定石(雙方都不吃虧的已知落子順序)在某一手之後有三種最常見的變化,策略網路學完後,這三個落點的機率應該是最高的。測試發現,策略網路預測人類落點的正確率達到57%,所需時間是三毫秒,我稱之為「仿人網路」。DeepMind另外訓練了快速仿人網路,只要兩微秒就能選出落點,但正確率只有24%。

有了仿人網路就可以下圍棋了,每一手可以依其預測的機率選定落點,比方說,有三個落點A、B、C機率各是10%、40%、50%,如果碰到完全相同的局面100次,大約有10次會下A、40次下B,依此類推。

第二階段是有獎賞的練功,術語是加強學習。練功就是左右互搏,左手是最新版的策略網路,右手從眾多舊版策略網路中任選一個。獎賞就是左右手下完一盤棋後,勝者走過的各著手機率上升,敗者走過的著手機率下降,調整後就誕生新版的策略網路。不斷練功,策略網路也就逐漸變強。練出來的策略網路對上仿人網路的勝率達到80%。

人一天不吃不喝也許能下完並檢討10盤棋,AlphaGo在「精神時光屋」裡練功,一天下個幾萬盤棋都沒問題,才能在短期內進步神速。

第三階段訓練形勢判斷的能力:給定一個盤面,如果之後雙方每手都是最佳著手的話,誰會贏?但沒人知道浩瀚的棋局變化中最佳著手是什麼,所以退而求其次,讓雙方都用策略網路下棋。因為策略網路每一手都有機率,勝負不固定,問題就變成:如果雙方都用策略網路下棋,勝率是多少?

為了回答這個問題,DeepMind建立了估值網路,從KGS的3000萬盤棋中每盤隨機挑一個盤面,讓策略網路接手互搏到終局,並記下勝者。然後拿這3000萬盤棋局用加強學習來訓練估值網路。有了估值網路,每個落點是好是壞就可以很快判斷,不需要拿策略網路模擬到終局,省下1萬5000倍的時間。
【欲閱讀更豐富內容,請參閱科學人2016 年第 171 期 05 月號】

參考資料:http://sa.ylib.com/MagCont.aspx?Unit=columns&id=2963


活動訊息_圖示

武俠片裡的輕功有可能練成嗎?——科學史札記(六)

2013022521052403c7a

先父任職立法院,我在立法院職員宿舍光明新村長大。村中有位李大爺,山東肥城人,他是立法院職員,也是國大代表。李大爺出身齊魯大學,在校時鍾愛健美和體操。當年李大爺家有整套健身器材,小時候常到他們家練習。有一天,到他家玩時,李大爺對我說了一段他親眼目睹的經歷。

那是抗戰以前,韓復矩任山東省主席時。韓復矩提倡國術,請到一位武術家表演輕功,消息傳到齊魯大學,喜歡體育的李大爺當然不會錯過。這位武術家表演徒手攀登寶塔,當時李大爺正在學體操,看得格外受用。

李大爺說,表演者在塔下躍起,抓住第一層塔的屋簷,然後一個翻身,已躍上第一層。如是這般,手腳並用,一層層攀升。李大爺說,他這才知道,輕功其實和體操相去不遠。他又說,當時要是有人指點,他自信也能做到。

根據李大爺敘述,攀上屋頂須手腳並用;換句話說,躍上屋頂的先決條件是手要能抓住椽木或屋簷,絕非從地面直接竄上屋頂。我服兵役時看過戰技表演,特種兵藉著短跑的衝力,可以垂直奔上高牆中段,當手搆到牆頭時,一撐躍上高牆。始自戰技訓練的極限運動 Parkour(跑酷),也是手腳並用,和輕功相彷彿,惟不用於格鬥而已。

Daniel_Ilabaca

跑酷運動者Daniel Ilabaca 正在演練「貓平衡」動作。Jon Lucas攝,創用CC 姓名標示-相同方式分享 3.0

總之,輕功不可能違反力學,也不能違反人體的結構和生理。或曰:身輕如燕如何?瘦子體重固然較輕,但肌力相對較弱,對跳高並沒多大助力。運動場上的跳高選手莫不肌肉勻稱、胖瘦適中。2004 年雅典奧運跳高金牌瑞典選手Holm Stefan,身高 181 公分、體重 69 斤,這是多麼美好的組合!

Holm Stefan 的金牌成績是 2.36 公尺。就算武林人物一躍能跳 2.36 公尺,要想飛身上屋,大概只能躍上低矮的民宅。再說,Holm Stefan 的 2.36 公尺是用背滾式跳的,用剪刀式不可能跳出這個成績。武林人物如用背滾式,勢將背部先著地,不摔個七葷八素才怪!

古人的輕功可以達到何種境界?當代武術大家萬籟聲(1903~1992)著有《武術匯宗》(商務印書館,1929),該書第三章、第三節對於輕功的練法略有描述,大致以練習縱跳、擰身、抓握、平衡等為主,並無違反力學之處。

chnxn2008082210
《臥虎藏龍》中李慕白和玉嬌龍站立竹枝比武的片段。

 

以武俠小說(或影視)的「飛身上屋」來說,顯然是不可能的。再以經典武俠片《臥虎藏龍》的踏水追逐、站立竹枝等「輕功」來說,也都違反物理原理。要想踏水不沉,除非鞋子的底面積夠大──大得像條小船,否則水的浮力不可能支撐人的重量。至於在竹枝上站立,竹子的剛性哪能支撐人的體重?劇終時玉嬌龍騰雲滑翔,可曾想到重力加速度?《臥虎藏龍》的武打相當真實,但誇張不實的輕功將它的「寫實」性減弱了。

筆者常想:如果武俠影視的輕功能夠合乎力學,那將何等真實、優美!筆者有位外國朋友喜歡看武俠片,但他說:「你們的武術不如日本。」問他為什麼?他說:「日本的武士片看起來像真的,你們的武俠片看起來像假的。」他所謂像假的,主要是指輕功。其實,只要稍用點心,將輕功拍得像真的並不難。

我們希望重振大漢天威,但武俠小說愈寫愈神奇,兩岸三地的武俠影視也愈拍愈奇幻,這說明我們民族還不能走出自我麻醉的陰霾,距離我武維揚還遠著呢。

(原刊《科學月刊》2005 年 6 月號) 文章來源網址:http://pansci.asia/archives/97233


活動訊息_圖示

主  題:廣義相對論的新世紀─ 從難以置信到不可或缺
日  期:105年5月10日(星期二)13:00 17:10
講  師:陳義裕教授
地  點:嘉義高工行政大樓四樓視聽教室
報名網址:教育部全國教師在職進修網登錄報名,課程代碼:1978632

主  題:從206南台地震談地震物理學
日  期:105年5月17日(星期二)13:10~17:20
講  師:蔡旻倩研究員、甘志文研究員、郭鎧紋主任
地  點:交通部中央氣象局
報名網址:教育部全國教師在職進修網登錄報名,課程代碼:1996723
注意事項:因場地座位有限,限額50名,恕不接受現場臨時報名,亦不提供候補名額。

主  題:翻玩科學創意講堂-教學研討活動
日  期:105年5月19日(星期四)13:30~17:20
講  師:台灣大學石明豐教授、麗山高中吳明德老師
地  點:臺中一中 慎思樓7F多媒體教室
報名網址:教育部全國教師在職進修網登錄報名,課程代碼:1979391

主  題:VPhysics Python 於高中物理上之應用
日  期:105年5月26日(星期四)9:30~12:10
講  師:台灣大學石明豐教授
地  點:高雄市立三民家商H棟8303電腦教室
報名網址:教育部全國教師在職進修網登錄報名,課程代碼:1982736

主  題:2016高瞻計畫教師工作坊
日期地點:北區105年5月21日(六)國立臺灣大學博雅教學館。
     中區105年5月28日(六)國立臺中一中慎思樓/科學館。
議  程:http://goo.gl/hEJEP6
報名方式:請依參加場次至下列網址進行網路報名。
     北區場 https://goo.gl/aQXJyb
     中區場 https://goo.gl/ksFFkc

主  題:科學史講座(五)
日  期:105年5月31日(星期二)14:00~17:10
講  師:胡志偉教授、王道還教授
地  點:國立臺灣大學思亮館國際會議廳
報名網址:教育部全國教師在職進修網登錄報名,課程代碼:1969039

 
科學活動及演講_圖示

主  題:為什麼愛因斯坦一度不相信重力波 — 重力波的故事
日  期:105年5月21日週五晚間7:00-9:00/6:30PM開放入場
地  點:國立臺灣大學應用力學研究所一樓國際會議廳
活動網址:http://highscope.ch.ntu.edu.tw/wordpress/?p=69741

主  題:遨遊星際-從太空探索談移民宇宙實現的可行性
日  期:105年5月22日10:00~12:00
地  點:科工館北館地下一樓簡報室(AB103)
活動網址:http://www.nstm.gov.tw/NewsDetailC110.aspx?Cond=dd244336-34c0-445e-a63f-e9db6b4f4f4c

主  題:2016青年尬科學
報名時間:2016年5月16日至2016年7月6日
活動網址:http://case.ntu.edu.tw/scinarrator/wordpress/

主  題:超亮X光神燈─臺灣光子源之興建挑戰
日  期:105年6月12日10:00~12:00
地  點:國立科學工藝博物館南館國際演講廳
活動網址:http://freesci.tw:8090/scholarmatch/page.activityshow.action?id=16

 
 

物理學科中心承辦學校為臺中第一高級中學
物理學科中心網址: http://physical. tcfsh.tc.edu.tw/ 
物理學科中心FB粉絲專頁:http://goo.gl/2hDFA3


一、 學科中心提供的服務
  • 教師專業成長相關進修研習
  • 教材教法示例與各類教學資源分享
  • 課程宣導與推廣
  • 學科實務意見蒐集
  • 教師討論網路平台
  • 發行學科電子報
二、 學科中心推動工作
  • 研發及蒐集學科教學資源
  • 培訓學科種子教師
  • 規劃辦理分區或縣市教師增能研習
  • 建置學科教師區域聯繫網
  • 學科中心電子報與網路平台服務
 

 

 


物理學科中心網址: http://physical.tcfsh.tc.edu.tw/
聯絡電話:(04)22226081轉811        email  聯絡信箱:physics@tcfsh.tc.edu.tw
聯絡人: 蔡沛霖