ブロスタのAIを強化学習で作る③

2023年5月7日 00:28

こんにちは。しげまつです。
ブロスタAIが少し進んだのでまとめます。

今回やったこと

リザルト画面から報酬を受け取る
行動を起こす

リザルト画面から報酬を受け取る

前回作ったモデルで1位だったら報酬を１負けたら報酬を-1として受け取れるようにしました。

#リザルト画面から報酬を受け取る
def get_reward():  
    if pred[0] > 0.997:
        reward = 1
    elif pred[1] > 0.997:
        reward = -1
    return reward

行動を起こす

移動する方向として8方向と攻撃をするかしないかで16通りの行動をランダムにしてみました。

def action_button(action): 
    #攻撃なし・移動のみ
    if action == 0:
        pyautogui.keyDown("w") #前
    elif action == 1:
        pyautogui.keyDown("a")#左
    elif action == 2:
        pyautogui.keyDown("d")#右
    elif action == 3:
        pyautogui.keyDown("s")#後ろ
    elif action == 4:
        pyautogui.keyDown("w",'a')#左前
    elif action == 5:
        pyautogui.keyDown("w",'d')#右前
    elif action == 6:
        pyautogui.keyDown("d",'s')#右後ろ
    elif action == 7:
        pyautogui.keyDown("a",'s')#左後ろ
    #攻撃あり・移動あり
    elif action == 8:
        pyautogui.hotkey("w",'e') #前
    elif action == 9:
        pyautogui.hotkey("a",'e')#左
    elif action == 10:
        pyautogui.hotkey("d",'e')#右
    elif action == 11:
        pyautogui.hotkey("s",'e')#後ろ
    elif action == 12:
        pyautogui.hotkey("w",'a','e')#左前
    elif action == 13:
        pyautogui.hotkey("w",'d','e')#右前
    elif action == 14:
        pyautogui.hotkey("d",'s','e')#右後ろ
    elif action == 15:
        pyautogui.hotkey("a",'s','e')#左後ろ

強化学習に必要な状態と報酬と行動をとれるようになったので次から本格的に学習させていければなと思います。

この記事が気に入ったらサポートをしてみませんか？