V sami igri zastopajo kazni (in nagrade, kjer je to primerno) uporabnost številke. Pozitivne številke predstavljajo dobre rezultate, negativne številke pa slabe rezultate in en rezultat je boljši od drugega, če je število, povezano z njim, večje. (Vendar bodite previdni, kako to deluje pri negativnih številkah, saj je na primer -5 večja od -20!)
V zgornji tabeli se prva številka v vsakem polju nanaša na izid za igralca 1, druga številka pa predstavlja izid za igralca 2. Te številke predstavljajo le eno od številnih števil, ki so skladne z dilemo zapornikov.
Ko je igra definirana, je naslednji korak pri analizi igre ocenjevanje strategij igralcev in poskusite razumeti, kako se igralci verjetno obnašajo. Ekonomisti navajajo nekaj predpostavk, ko analizirajo igre, najprej domnevajo, da se oba igralca zavedata izplačila tako zase kot za drugega igralca, in drugič, predvidevajo, da oba igralca iščeta do racionalno maksimirati svoje izplačilo iz igre.
Enostaven začetni pristop je iskanje tega, kar se imenuje
prevladujoče strategije- strategije, ki so najboljše, ne glede na to, katero strategijo izbere drugi igralec. V zgornjem primeru je izbira priznanja prevladujoča strategija za oba igralca:Glede na to, da je spoved najboljša za oba igralca, ni presenetljivo, da je izid, pri katerem se oba igralca izpoveduje, ravnovesni izid tekme. Glede na to je treba biti z našo definicijo nekoliko bolj natančen.
Koncept a Neš ravnovesje je kodificiral matematik in teoretik igre John Nash. Poenostavljeno povedano, Nash Equilibrium je skupek najboljših strategij odzivanja. Za igro za dva igralca je Nash ravnovesje rezultat, kjer je strategija igralca 2 najboljši odziv na strategijo igralca 1, strategija igralca 1 pa najboljši odziv na strategijo igralca 2.
Najti ravnovesje Nash-a po tem načelu je mogoče prikazati v tabeli rezultatov. V tem primeru so najboljši odzivi igralca 2 na igralca 1 obkroženi v zeleni barvi. Če igralec 1 prizna, je najboljši odziv igralca 2, da prizna, saj je -6 boljši od -10. Če igralec 1 ne prizna, je najboljši odziv igralca 2, da prizna, saj je 0 boljši od -1. (Upoštevajte, da je ta sklep zelo podoben sklepu, ki se uporablja za določitev prevladujočih strategij.)
Najboljši odzivi igralca 1 so obkroženi v modri barvi. Če igralec 2 prizna, je najboljši odziv igralca 1, da prizna, saj je -6 boljši od -10. Če igralec 2 ne prizna, je najboljši odziv igralca 1, da prizna, saj je 0 boljši od -1.
Ravnotežje Nash-a je rezultat, ko obstajata tako zeleni kot modri krog, saj to predstavlja skupek najboljših strategij odziva za oba igralca. Na splošno je mogoče imeti več Nash-ovih ravnotežij ali sploh nobene (vsaj v čistih strategijah, kot je opisano tukaj).
Morda ste opazili, da se ravnotežje Nash-a v tem primeru na nek način zdi premajhno (konkretno s tem, da ni Pareto optimalno), saj lahko oba igralca dobita -1 namesto -6. To je naravni rezultat interakcije, ki je prisotna v igri, teoretično pa ne bi bilo priznanje optimalna strategija za skupino skupaj, vendar posamezne spodbude preprečujejo, da bi bil ta rezultat tak dosežen. Na primer, če bi igralec 1 mislil, da bo igralec 2 molčal, bi ga spodbudil, da ga razigra namesto, da bi molčal, in obratno.
Zaradi tega lahko ravnovesje Nash-a velja tudi za izid, pri katerem noben igralec nima spodbude za enostransko odstopanje od strategije, ki je privedla do tega izida. V zgornjem primeru, ko se igralci odločijo priznati, noben igralec ne more bolje, če si premisli sam.