제로섬 게임에서 착취 가능한 전략에 대한 광범위한 통찰력
저자 :
(1) Avrim Blum, 미국 일리노이 주 시카고의 Toyota Technological Institute;
(2) 미국 일리노이 주 시카고의 Toyota Technological Institute, Melissa Dutz.
링크 표
초록 및 1 소개
2 설정 및 2.1 행동 편향된 상대 모델
3 예선과 직관
4.1 근시 최고 응답자 및 4.2 도박꾼의 오류 상대
4.3 승리, 상대를 잃어 버린다
4.4 리더 상대와 4.5 최고 평균 상환 상대
5 일반화
5.1 기타 행동 편향된 전략
5.2 알려진 전략 세트에서 알려지지 않은 전략 활용
6 미래의 작업 및 참고 문헌
부록
A.1 Win-Stay Lose-Shift 변형 : 타이 스테이
A.2 추종자 변형 : 제한된 역사
A.3 타원체 실수 경계
A.4 최고 평균 상환 상대
5.1 기타 행동 편향된 전략
자연스러운 질문은 허용 가능한 게임의 거의 모든 라운드 (정의 1)를 이길 수있는 어떤 종류의 행동 편향된 전략을 이길 수 있습니까? 분명히, 우리가 상대방의 행동을 예측하고 상대방이하는 행동에 대한 최선의 반응을 배울 수 있다면, 우리는이 목표를 달성 할 수 있습니다.
상대방의 행동을 예측합니다
최고의 응답을 배우는 것
더 어려운 질문은 상대방이 할 수있는 모든 행동에 대한 최상의 반응을 배우기 위해 악용 할 수있는 결정 론적 전략입니다. 우리는 모든 결정 론적 전략에 대해 이것을 할 수는 없습니다. 항상 같은 행동을하는 매우 간단한 상대를 고려하십시오. 이 경우 상대방의 놀이는 a에 대한 최상의 응답에 대한 정보를 공개하지 않습니다.
▶ 관찰 7. 라운드에서 승리하기 위해 알려진 결정 론적 전략을 악용하는 것이 항상 가능하지는 않습니다.
모든 합리적인 행동 전략 이이 속성을 가지고있는 것은 아닙니다. 앞에서 논의한 바이어스 된 반대자 중 일부는 도박꾼의 오류 상대, 승리를 거두는 상대방의 타이 스테이 변형 및 최고 평균 상환 상대입니다.
Post Comment