السابق جوجل الموظف على لعبة البوكر السير الفيزياء. الرياضيات.كود لعبة البوكر المساعد

والثاني جوجل (من إلى)

إيريك جاكسون هو عالم و المطور من لعبة البوكر السيرومنذ بدأ هذا النشاط لكسب شعبية بعد إنشاء يقهر الحد بوت ، في مقابلة يخبرنا عن ما أوصله إلى هذه المنطقة من لعبة البوكر عن بعض الفروق الدقيقة بوت العلم.

درست في جامعة ستانفورد ، حيث حصلت على درجة الدكتوراة في الفلسفة و الأنظمة الرمزية.

بعد الانتهاء من دراستي ، لقد عملت كمهندس برمجيات لاثنين من الشركات من عام إلى عام. كان أول من فارق بسيط (من إلى) ، وهي الشركة المصنعة من برامج التعرف على الكلام. لقد كنت دائما تشارك في الأنشطة المتعلقة بتطوير الذكاء الاصطناعي ، سواء كان ذلك التعرف على الكلام ، فهم اللغة ، أو غيرها من المشاريع. بعد خروجه من جوجل ، شاركت في مختلف آلة التعلم المسابقات ، بما في ذلك نيتفليكس بجائزة بوكر المنافسة. لقد تم أخذ جزء في الأخير لعدة سنوات في أدوار مختلفة ، بما في ذلك الرئيس من المسابقة ورئيس الدراسية التدريبية التي يعمل جنبا إلى جنب مع المنافسة. بدأت لعب البوكر في وقت ما في عام عندما كان لا يزال يعمل في. عقدنا صغيرة البطولات بعد العمل مرة واحدة في الأسبوع. في نفس الوقت, بدأت اللعب على الانترنت واحدة في الغالب-ألعاب الطاولة على الطرف بوكر. عند نقطة واحدة ، أعطيت دولار في ، وقررت في محاولة للحصول على أكبر قدر من المال ممكن. بقدر ما أستطيع أن أتذكر, لقد نسج يصل إلى دولار, و لعبت لفترة من الوقت, ولكن بعد ذلك حصلت حقا بالحجارة و قد سحب المال بعد يوم الجمعة الأسود. في مكان ما حوالي ست سنوات من العمر. إنه أشبه ما يكون وظيفة بدوام جزئي. وعادة ما يستغرق عدة أشهر إلى كتابة التعليمات البرمجية.

أنا في الغالب لعبت الجداول

بعد ماذا البرنامج هو العصاميين لعدة أشهر ، أي أنه يتعلم للعب. خلال هذه الفترة, أنا فقط بحاجة للتأكد من أنه يعمل بشكل صحيح. في النهاية قبل المسابقة نفسها ، لدينا حوالي شهر لاختبار ووضعها في الشكل المناسب. أنا فقط عملت مع هولدم ، وهي حد ولا حدود رؤساء متابعة. الكمبيوتر لعبة البوكر المنافسة تقليديا ميزات ثلاث مباريات فقط اثنين كما ذكرت سابقا, و الحد هولدم على ثلاثة لاعبين. هذا هو في الأساس سبب إختياري. لقد مختلفة السير على جداول مختلفة لعبة الأشكال, و بالطبع فهي مختلفة عن حد و لا حد هولدم. ولكن خوارزميات بسيطة من هذه السير لديهم الكثير من القواسم المشتركة. لماذا لا يوجد مسابقات ألعاب مثل أوماها, مسمار, أو رسم لعبة البوكر ؟ هل تكون مهتمة في العمل في هذا الاتجاه ؟ لا أعتقد أن الألعاب مثل أوماها أو سبعة بطاقة الزر هي مختلفة جدا من هولدم. على الأرجح كنت قد استخدمت نفس الخوارزميات في نفوسهم. مع بوكر قد يكون أكثر صعوبة ، كما في وقد حلول إضافية ، ولكن النهج ، في عام ، لن تختلف كثيرا. الانتقال من ثابت حجم الرهان (كما في الحد هولدم) إلى متغير حجم الرهان (كما في لا حدود أو وعاء الحد هولدم) ، شجرة القرار بشكل ملحوظ ، حيث أن كل ممكن حجم الرهان هو مختلف رسم الخيار. ونحن لا تزال تستخدم نفس الخوارزميات ، ولكن هناك أيضا اختلافات. وأود أن نسمي هذه الألعاب مختلفة قليلا. أساسا لأنها هي أكثر تعقيدا بكثير ، مما يعني أن لدينا الحلول سوف تنحرف أكثر من مثالية غير قابلة للاستغلال اللعبة. الانتقال من رؤساء متابعة مباريات الألعاب إلى ثلاث أو أكثر من اللاعبين ، الأمور أكثر تعقيدا لأسباب عديدة. أول قرار شجرة تنمو إلى لا يوصف الحجم ، لأن لدينا الآن المزيد من الطرق للعب اليد مع مراعاة إضافية للاعبين. ثانيا ، في أقرب وقت كما كنت تذهب أبعد من رؤساء متابعة ، الخوارزميات المستخدمة لم تعد تتطابق مع النظرية. قلت أن يستغرق عدة أشهر لتدريب السير. أنها تلعب في كل وقت ضد نفسك. لا بوت الاستمرار في تعلم المزيد, أو هل تدعيم استراتيجيتها قبل المسابقة ؟ بلدي السير لن ضبط خلال المباراة. قبل أن تلعب أول يد, أنها تذهب من خلال فترة التدريب خلالها أنها محاولة للحصول على أقرب إلى ناش توازن ممكن في اللعبة. ولكن بمجرد أن تبدأ اللعب مع خصومهم أنهم لا تتكيف مع أي تغييرات في الاستراتيجية. أما بالنسبة بوت عملية التدريب ، فإنه يمكن أن يسمى لعبة ضد نفسها. يمكنني استخدام خوارزمية تسمى المغاير الأسف الحد ، والتي كانت معروفة على نطاق واسع في السنوات الأخيرة. نبدأ مع عشوائية استراتيجيات موقعين (زر كبير أعمى) ، ثم ترك كل استراتيجية تلعب ضد بعضها البعض. مع كل خطوة نقوم بحساب استراتيجية جديدة لكل موقف. الاستراتيجية النهائية هي متوسط قيمة جميع الاستراتيجيات درس في كل مرحلة. هذا هو تماما المجال التقني ، ولكن حسنا. تخيل أن استراتيجية مهمة الاحتمالات كافة الإجراءات الممكنة في جميع الممكن مراحل اللعبة. في تلعبوا استراتيجية ، على سبيل المثال ، فرع واحد من شجرة يخبرك أنه عندما يلعب رفع-الدعوة الاختيار-الاختيار -تحقق مع على النحو - النهر, يجب أن تحقق مع احتمال, الرهان نصف وعاء مع احتمال, الرهان مع احتمال, وهلم جرا. قد يكون لديك عدة احتمالات أخرى ممكنة الرهان الأحجام.

ونتيجة لذلك ، يجب الاحتمالات الممكنة اليدين في كل المجالس مع كل الرهان الجمع بين ما يصل إلى هذه النقطة.

باستخدام المغاير الأسف الحد ، مرارا وتكرارا النظر في الوضع نفسه وحساب استراتيجية لكل لاعب عن كل التكرار. نحن نتعامل مع قيمة يسمى يندم على كل عمل في كل مرحلة من مراحل اللعبة.

الأسف هو كم يمكنك أن تكسب من خلال اللعب على اليد بطريقة معينة مختلفة عن سابقاتها.

ثم نستخدم الأسف قيمة لضبط جميع الاحتمالات. عن طريق تشغيل أكثر وأكثر التكرار الكلي الأسف يصبح أقل ، حيث بلغ متوسط استراتيجية محسوبة على جميع التكرارات السابقة يحصل على أفضل وأفضل. هذا يمكن أن تظهر رياضيا. وانخفاض الأسف كلما اقتربنا من توازن ناش ، أي غير مستغلة اللعبة. الكمبيوتر لعبة البوكر المسابقة هي مسابقة سنوية بالنسبة للأشخاص الذين يرغبون في إنشاء لعبة البوكر السير ، والباحثين في هذا الاتجاه. في الصيف الماضي, التاسعة المسابقة في تاريخها عقدت. تقليديا ، وتتضمن المسابقة التنافس في ثلاثة مجالات: هو الحد عقد طب الطوارئ ، هو بلا حدود و حدود عقد معه لمدة ثلاث لاعبين. أطلقنا مؤخرا ثلاث لاعب كوهن مسابقة بوكر نسخة مبسطة جدا من هولدم مع ثلاث بطاقات سطح السفينة. المسابقة المشاركين على حد سواء الباحثين اللاعبين أنفسهم. ممثلو جامعة ألبرتا وجامعة كارنيجي ميلون كانت نشطة بشكل خاص في السنوات الأخيرة. وتهدف المسابقة إلى تشجيع البحوث في مختلف مجالات بوت العلم ، بما في ذلك: خلق ثابت السير (مثل أفعل ، على سبيل المثال) التي تحاول الحصول على أقرب إلى توازن ناش ممكن ، وضبط تلك التي تحاول استغلال الخصم الاستراتيجية. كون لعبة البوكر ؟ اثنين من لاعب النسخة تم تصميمها خصيصا سهلة-حل اللعبة. هل تغير الوضع مع المزيد من اللاعبين ؟ ما هي أسباب لها إدراجها في المسابقة ؟ على الرغم من انها لعبة بسيطة ، إصدار المزيد من اللاعبين لا يمكن حلها بالمعنى التقني. إذا بوت يلعب استراتيجية أقرب إلى توازن ناش ممكن ولا يمكن استغلالها ، يمكن هزم اثنين آخرين السير اختيار كاف استراتيجيات منسقة. لذلك الهدف ، في رأيي ، هو أن تجد لعبة بسيطة إلى حد ما يمكن أن تركز على الاختلافات بين لعبة لمدة سنتين و عدد كبير من اللاعبين ، على سبيل المثال ، فيما يتعلق بنقص غير مستغلة التوازن إمكانية التواطؤ. على الرغم من أن اللعبة هو بسيط, العثور على أفضل واحد الطريق إلى تحقيق أقصى قدر من الأرباح من الصعب جدا. بمناسبة حلول في الآونة الأخيرة كانت هناك أنباء أن تحد من رؤساء متابعة هولدم تم حلها أخيرا. وهذا يعني أنه لن يكون من مصلحة لإدراجها في برنامج المنافسة. ماذا في رأيك يمكن أن يحل محله ؟ في الواقع, لدينا اثنين من المسابقات لكل لعبة.

أول السير تشجيع الحد الأقصى تقترب توازن ناش في الثانية الرئيسي التقييم المعيار هو مجموع الربح بوت الذي يلعب على أداء استراتيجية ضد المعارضين ضعيفة.

لذا, نعم, الحد الأول هولدم المنافسة الآن لا معنى له, ولكن الثانية لا يزال لديه المكان المناسب ليكون. أما بالنسبة المنافسة الجديدة ، أود أن أرى شيئا حقا صعبة و خاصة مثل أو. ولكن هناك بعض الصعوبات التقنية. لذا, فعلى سبيل المثال, أنا لست متأكدا من أن النتائج التي تم الحصول عليها سيكون لها دلالة إحصائية. حتى أن بعض (بما فيهم أنت) تكتب عدم استغلال الحزب السير التي يجب أن تلعب "تماما" من حيث نظرية اللعبة.

آخرون إنشاء السير التي تحاول استغلال نقاط ضعف خصومهم.

أي من هذه النهج هو أكثر شعبية في حل (أو تحل) مباريات في الآونة الأخيرة ؟ في المنافسة ، السير التي تلعب أقرب إلى توازن ناش ممكن عادة الفوز التشغيلية السير في ها.

هناك عدة تفسيرات لهذا. التكيف في حد ذاته أمر صعب. الحزب السير قوية جدا ، العمل في مجال التكيف ربما يكون أقل نضجا الدولة من العمل في الميدان من الحزب. بالإضافة إلى المباريات الماضية فقط اليدين. هذا العدد قد لا يكون كافيا لتعلم شيء خاص حول الخصم الخاص بك إذا كنت لا تجعل الكثير من الافتراضات تلك الافتراضات تتحول إلى أن تكون صحيحة. هل أنت قريبة من حل الألعاب مثل بلا حدود عقد م ؟ هي الحزب السير على استعداد ، أو هل لا يزال أمامنا طريق طويل للذهاب ؟ بالإضافة إلى الحد من رؤساء متابعة ، في هذه اللحظة فقط ألعاب بسيطة (مثل كون البوكر لاعبين اثنين) التي ليست مثيرة للاهتمام يتم حلها. الشيء الرئيسي الذي ساعد في حل حد هولدم القدرة على دقة قياس القابلية للاستغلال. ونحن لا يمكن أن تفعل الشيء نفسه بالنسبة لنا تلعبوا السير ، ولكن الرجال في جامعة ألبرتا كانت قادرة على العثور على الأقل الأدنى على القابلية للاستغلال من الأخيرة السير ، واتضح أنه كان لا يقل عن كبيرة الستائر لكل مائة اليدين! في حين أن هذا قد يبدو صادما (أربع مرات أسوأ من مجرد يطوي كل جهة) ، تذكر أن القابلية للاستغلال هو أسوأ النظرية متري. في لعبة حقيقية ضد الإنسان ، معظم الوجوه سوف تكون رقيقة جدا, وسوف يكون لا يزال من الصعب جدا بوت للعب. حتى آخر أخبار الناس هو أنه لا يوجد حد هولدم لا تزال بعيدة عن الحل. هل الكمبيوتر لعبة البوكر المنافسة تقتصر على السير مقابل السير? أو هل هناك مسابقات مماثلة حيث السير تتنافس ضد بعضها البعض ؟ الناس ؟ قبل هذا الحد رؤساء متابعة تقرر ، كانت هناك عدة رجل مقابل بوت المباريات. أعتقد أن مثل هذه المباريات سيكون لها الكثير من الفائدة في محاولة حل بلا حدود هولدم. ومع ذلك ، من أجل التأكد من أن النتائج إحصائيا ، نحن بحاجة إلى الآلاف والآلاف من أيدي الناس على استعداد للعب هذه الكميات. شكرا لكم على قراءة هذا المقال حتى النهاية! إذا كنت مثل هذه الملاحظات ، ثم ترك تعليق, أو مثل أي تعليقات أخرى:).




لعبة البوكر مساعد النقابات استعراض لعبة البوكر مجموعة حاسبة حاسبة من أجل لعب البوكر الأناناس برقية بوت من لعبة البوكر مجانا لعبة البوكر آلة حاسبة التطبيق من ناحية لعبة البوكر آلة حاسبة المحل