国产精品乱码一区-性开放网站-少妇又紧又爽视频-西西大胆午夜人体视频-国产极品一区-欧美成人tv-四虎av在线-国产无遮挡无码视频免费软件-中文字幕亚洲乱码熟女一区二区-日产精品一区二区三区在线观看-亚洲国产亚综合在线区-五月婷婷综合色-亚洲日本视频在线观看-97精品人人妻人人-久久久久久一区二区三区四区别墅-www.免费av-波多野结衣绝顶大高潮-日本在线a一区视频高清视频-强美女免费网站在线视频-亚洲永久免费

機械社區(qū)

標題: 如何讓機器人通過自學習的方式學會玩“石頭、剪刀、布”游戲? [打印本頁]

作者: 劉景亞    時間: 2016-4-8 17:44
標題: 如何讓機器人通過自學習的方式學會玩“石頭、剪刀、布”游戲?
本帖最后由 劉景亞 于 2016-4-11 18:26 編輯
. r- S# a, M& }
& N, M8 j1 J4 V1 T7 {$ C前段時間的人機圍棋大戰(zhàn)賺足了人們的眼球,Google公司的AlphaGO也使機器學習和深度學習讓更多的人有了一定的了解,可謂做了一次很好的科技普及。$ b$ u6 L. _, h0 g7 w
現(xiàn)在我們從簡單問題入手,如何基于機器學習,通過自學習的方式讓機器人學會玩“石頭、剪刀、布”游戲?" X& z5 y# n0 ^( f" L& G2 h9 r) Y
不知大家有何建議?歡迎大家發(fā)言參加討論。

6 t& Q( t. _* ~' q! A*******************************************************************************************
4 W% p* V7 l# n# z* P分割線以上為原貼
! I3 e& M2 D" Y*******************************************************************************************
/ V$ Y/ Z4 b8 E非常感謝各位大俠的參與和討論。
" ~2 {' p, q) \關于機器人玩“石頭、剪子、布”游戲,我本打算分三個問題和步驟和大家一起探討。看到討論中,大家對這三個方面都有所涉及。! H% }$ o/ V6 l0 S! a
下面我把我對這個問題的認識拋出來與大家交流分享。" u( |7 S: a8 f0 s3 @8 e1 L
要讓一個機器人玩“石頭、剪刀、布”,我們分三步走。
  S- o6 e- b* F# S第一步,如何讓機器人通過自學習的方式學會游戲規(guī)則?比如,一開始機器人并不知道石頭、剪子和布,哪個贏哪個,要玩游戲首先得學會規(guī)則。當然要實現(xiàn)這一步,有比較簡單的辦法,最直接的是程序員編程時,直接定義這個規(guī)則,這是以前經常用的傳統(tǒng)的方法。現(xiàn)在我們想通過一種新的方法來實現(xiàn),讓機器人像小孩一樣,通過不斷地實踐、摸索和總結掌握這個規(guī)則,也就是自學習和機器學習。
6 s9 m2 q- A$ e9 G( v/ v第二步,如何讓機器人在掌握規(guī)則后大概率獲勝?' G4 d  O( l! V/ Z
第三步,能不能通過一種方法,使機器人在每局對戰(zhàn)時100%獲勝?
: ^& o3 o  i" b: n/ S, {) t: H*****************************************************************************************" |- o6 |  I8 x; s1 q* p* @
關于第一步,可以用如下方法實現(xiàn):讓機器人和人對戰(zhàn),在對戰(zhàn)的實踐過程中訓練機器人,使其不斷自學習以掌握規(guī)則。在對戰(zhàn),人始終隨機出,機器人一開始并不知道規(guī)則,也隨機出。贏了有獎勵,輸了有懲罰,隨著對戰(zhàn)次數(shù)的增多,機器人就會對出拳的種類形成“價值判斷”。在訓練過程中,機器人會反復判斷,是隨機出還是基于已經學到的部分知識。經過不斷訓練,機器人就會學會游戲規(guī)則。這個過程區(qū)別于以往的程序員直接定義,和人類的學習過程十分類似。7 k! R8 ^, P) _. v- W
那么這個方法有沒有效果,我們驗證一下。8 S6 m  [9 w% T7 j" r- F0 Q
下圖是我與機器人玩25局的情況,注意這個機器人一開始并不知道游戲規(guī)則。我隨機出拳,機器人一開始也隨機出,贏了獎勵,輸了懲罰。大家會發(fā)現(xiàn),從第11局開始,機器人就已經完全掌握了規(guī)則。7 K, w5 V3 e. _4 s

! I$ O+ i% E8 k2 [) R
[attach]383558[/attach]
2 }9 X& x4 {6 K8 `2 R9 o- M! }2 h, ]3 L- D8 w
) ~- i& ]  u4 m* T9 R

: {7 v4 {  D4 |( P+ u
作者: pacelife    時間: 2016-4-8 17:54
這種純概率的東西,要做算法是很簡單,但是勝率要提上去不容易啊
作者: 2266998    時間: 2016-4-8 18:15
應該上一個圖形處理系統(tǒng),先分辨對面這家伙是誰,再決定怎么玩,( w) R. u3 a) Z, ?9 [

2 e0 O& U, V3 p3 ]3 }人的活動,是有固定姿態(tài)的,比如下一步怎么活動,有細微表現(xiàn),總結了這些姿態(tài),就可以勝了對面的家伙,% S  T' k& w- t; p2 |
4 F% M+ F' d; v8 r

作者: crazypeanut    時間: 2016-4-8 18:38
本帖最后由 crazypeanut 于 2016-4-8 18:39 編輯 ( O& G8 ]+ ^# o5 i: v# B

" L# N" O. h* b" \  M+ _2 X如果不考慮心理學因素的話,猜拳不是博弈系統(tǒng),是一個純概率系統(tǒng),樣本空間為(剪,石),(剪,布),(剪,剪),(石,剪),(石,布),(石,石),(布,剪),(布,石),(布,布)9 I0 e& _( X: g; _' ~. G/ ^- o  T2 R
' Z6 F9 m' k& i
獲勝組合是(剪,布),(石,剪),(布,石),概率為1/3,相應的,平局組合和輸?shù)艚M合均為1/3
( N/ G& F$ B1 A. ?" t0 u2 h$ o
% D8 }7 s1 g! T6 h因此,如果沒有心理學算法在里面,用隨機算法隨機選擇出拳的話,獲勝幾率不會超過1/34 K& {: R; K& y1 e- N) S' R4 s

7 z  s& k/ ?" x6 v  o$ `3 k& K# Q而將心理學因素考慮進去,就像8爺所說的,要加上圖形系統(tǒng),增加了復雜性,也偏離了正道
, G( j' y+ r" L4 v6 v4 z
9 @# C0 x& [( h% \" U! F個人建議,選擇五子棋或者黑白棋作為研究對象更合適,五子棋和黑白棋應該算是最簡單的博弈系統(tǒng)了,棋子就黑白兩種,相對容易處理
+ f7 e. U- E# h# X$ S. H$ I
! Y8 Q- m4 O+ Q; Y有人可能說井字棋更簡單,但是作為博弈系統(tǒng),井子棋有不敗的策略,沒有太大的研究價值
作者: 木子12    時間: 2016-4-8 19:06
crazypeanut 發(fā)表于 2016-4-8 18:38
* R& F8 k( t" a1 m如果不考慮心理學因素的話,猜拳不是博弈系統(tǒng),是一個純概率系統(tǒng),樣本空間為(剪,石),(剪,布),(剪 ...
3 [- _3 b" {0 Y
之前好像有一個日本的機械手,就是這么干的,動作相當靈活+ Z/ R1 Z# ~8 h

作者: fiyu1314    時間: 2016-4-8 19:54
     玩石頭剪刀布沒問題。很簡單。生成1 2 3 隨機數(shù)分別代表石頭剪刀布。  自學習估計這個論壇里懂得就少了。去個程序員論壇估計能弄明白自學習的程序的都不多。頂多就是 分析下 這個人出什么的概率,和出完什么再出什么的概率。然后弄個算法分析下他會出什么的概率最大。再高科技點,就分析他出什么之前的渾身表情動作等。
作者: 冷月梧桐    時間: 2016-4-8 20:25
這是一個隨機概率的問題,石頭,剪刀,布就是三個動作點,然后隨機輸出一個動作點就會呈現(xiàn)一個動作就好了,從理論上來講是完全可行的
作者: shiqi67    時間: 2016-4-8 20:45
樓主的意思應該是“如何讓機器人學會玩剪刀石頭布”,而不是“使機器人玩”剪刀石頭布吧……
( g* `% E, V1 G) z! C5 S樓上都跑偏了吧
作者: huiyu788    時間: 2016-4-9 07:58
可以根據(jù)對方出拳的情況,用多項式擬合,然后用多項式預測下一步對方出什么,對方每出一次拳,就修正多項式
作者: wsxm82    時間: 2016-4-11 10:14
用上“分歧終端機”呢,非誠勿擾里的那個
作者: 劉景亞    時間: 2016-4-11 18:42
下圖是我與機器人每次玩25局,重復了6次的實驗結果。0 e! a& b0 C6 }) D
圖中1表示機器人勝,2表示機器人負,3表示平局。. x; b, l1 y5 B. {" X
可以看出,機器人基本上在10局左右,就會掌握規(guī)則。

0 p; }" B% R3 H& n: E% a2 H4 J[attach]383559[/attach]
" B0 ~# \9 K0 k& X7 U! h- t0 }% T; O! |! E

+ K& `9 X* z! L# ^
作者: ywjianghu    時間: 2016-5-8 09:46
樓主位沒有說明,這個機器人是帶視覺識別系統(tǒng)的吧?
% e7 i7 X8 l- u( h! w單純從概率和經驗上,是無法判斷人接下去出什么的。
: j2 V* l5 K* \& G  u) G& T/ z$ N




歡迎光臨 機械社區(qū) (http://m.whclglass.com.cn/) Powered by Discuz! X3.5