ایده هایی برای بهبود بازی تخته نرد رایانه ای
فهرست محتوا
نگرش موقعیتی
بازیکنان انسانی خیلی به ویژگی های سطح بالایی که دارند اعتماد می کنند ويژگى هايى كه از طریق تجربه آموخته اند، در کتاب ها خوانده اند، از اينترنت و يا از طریق نرم افزار ياد گرفته اند. اکثر برنامه های تخته نرد بر این جنبه متركز مى باشد: توسعه ویژگی های سطح بالا که منعکس کننده انواع تفکرات انسان است. کارهای Tesauro نشان می دهد که این ویژگی ها می توانند کاملاً ارزشمند باشند حتی اگر یک شبکه عصبی وجود داشته باشد كه “ویژگی های” يادگيرى خود را دارا باشد. و اگر نکات مفیدی به آن بدهید سیستم یادگیری آسان تر مى شود. اگر سیستم یادگیری ندارید، واقعاً باید این کار را انجام دهید و به دنبال كسب ویژگی های رمزگذاری شده دستی باشيد. از آنجا که کارهای زیادی در این زمینه انجام شده است، اين موضوع برای من خيلى جالب نمى باشد، اما البته این احتمال وجود دارد که ویژگی هایی وجود دارد که محاسبه كردن آنها آسان است، حتى بسیار مفید است، ويژگى هايى که هیچ کس به آنها فکر نکرده است (یا حداقل اجرا نشده اند). انواع ویژگی هایی که به نظر من بیشتر مفید است به ترتیب تقریبی اهمیت عبارتند از:
• گره ها و shot هاى ريسك دار
• تعداد سهام / پیپ مسابقه
• ساختن نقطه
• قدرت prime
سایر ویژگی های پویا (به عنوان مثال رول هایی که از دست مى روند) تجربه شخصی من این است که ماهیت دقیق موارد اين ویژگی بسیار مهم هم دارد( به عنوان مثال، برای استحکام پرايم می توانید نقاط و فاصله ها را بشمارید، یا می توانید تعداد دقيق رول ها را براى حركت دادن مهره ها از پرايم ها تعيين کنید، يا اينكه مى توانيد آن را از طریق سایر روش ها اندازه گیری کنید). یکی دیگر از مظاهر بینش موقعیتی انسان، روشی که است كه بازيكنان موقعیت ها را طبقه بندی می كنند:
برگزاری بازی ها، حمله ها
Backgame ها و غيره. این مورد نیز در برنامه هاى رایانه استفاده شده است، هر چند با درجه کمتری (به عنوان مثال داشتن یک برنامه روتین براى بازی تمام موقعیت ها و مسابقات). من فکر می کنم تخته نرد قهرمانی خيلى از این روش استفاده نکرده است. مشکل اصلی تصمیم گیری در مورد نحوه پارتیشن بندی فاصله است. من فکر می کنم این روش مفید است، اما كم اهميت تر از ويژگى هاى آن است. نظرات دیگر من بیشتر به سرعت مربوط می شود، سرعت افراد (یا یک برنامه) در بازی بيشتر از سطح خود بازى است. اما این دو به هم ربط دارند، زیرا شما می توانید با طولانی تر فکر کردن، بازی خود را بهبود ببخشید، و می توانید به طریقی سریعتر فکر کنید، در همان زمان بیشتر. همچنین، از آنجا که دلیل اصلی وجود پرايم برنامه های کامپیوتر bg این است که سریعتر انجام می شود، پس ما می توانیم آنها را بسازیم، و اين بهتر است. من می خواهم یک
برنامه کلاس جهانی در رایانه من اجرا شود (در بالاترین سطح بازی) يك موقعیت شروع ٥٠٠٠ بار در یک ساعت بهتر از ٥ دقيقه است!
حذف خودكار حركت ها
انسان ها معمولاً فقط تعداد انگشت شماری از حرکت ها را در نظر می گیرند؛ اغلب از ده ها حركت فقط یکى از آنها را. همانطور که اخیراً در اینجا بحث شده است، رایانه ها به طور معمول به هر حرکتی نگاه می کنند، ممکن است گاهى اوقات به صدها حركت نيز برسد. من به یک روش ساده برای کاهش تعداد حرکت اشاره کردم: هیچ بازی ای را در نظر نگیرید که بیش از 2+ مورد در صفحه خانه برای شما هنگامى كه دوبل داريد و مهره هاى خود را به بيرون نمى بريد، دارد. این نسخه محافظه کارانه من است. شما می توانید آن را تهاجمی تر انجام دهيد، و به طور بالقوه بیشتر حرکات صحيح را حذف كنيد.
آیا افراد دیگر ایده هایی برای حذف حرکات دارند؟
یک ایده که من با آن بازی کردم، اما آن را عملی نکردم، این است که وقتی مثلاً می توانید در صفحه حریف خود ضربه بزنید، و شما هیچ گره ای در صفحه شخصی خود ندارید، و برخی شرایط دیگر ، پس هیچ بازی اى كه در آن ضربه نمى زنيد، نكنيد. این مثال ها پیچیده به نظر می رسند، اما در واقعیت دشوار است به چیزهایی برسید که فقط بسیار بسیار زیاد بتوانند حركت هاى خوب را ايجاد كنند. خيلى خوب است كه حركات ضعيف را انجام ندهيد، اما از آن مهمتر اين است كه حرکت های خوب را انجام دهيد. من فکر می کنم یکی از دلایلی که انسان ها این کار را به خوبی انجام می دهند اين است که آنها یک برنامه مشخص یا حداقل اهداف بخصوصى دارند. آنها مهره ها را به صفحه بیرونی خود مى برند زیرا هدف آنها به دست آوردن ٥ امتیاز است، نه فقط به این دلیل كه آن را بالاتر ارزیابی كردند ( يا بهتر به نظر برسد”). بنابراین وقتی آنها عددی را که به دنبال آن هستند در تاس مى آورند، ديگر به همه بازى های دیگر فکر نمى كنند؛ فقط اين را بررسى کنید كه هدف دستیابی به رتبه بالاتر امکان پذیر است، و سپس ساخت حرکت. من هیچى در مورد برنامه هاى هدفمند تخته نرد نمی دانم، اما به نظر می رسد ایده بسیار مفیدی است.
ارزیابی درجه بندی
حرکاتی که انسان ها در نظر می گیرند، معمولاً در همه موقعيت ها انجام نمى دهند. ممکن است آنها مدتی به پنج گزينه پيشنهادى نگاه کنند، سپس در مورد یکی كه ضعيف تر از بقيه به نظر مى رسد تصمیم بگيرند، آن را بیرون ببرند، و در مورد چهار گزينه ديگر بیشتر فکر کنند. و به همين نحو ادامه دهند تا اینکه در آخر به دو حرکتی که نمی توانند بین آنها تصمیم بگیرند مى رسند، بازیکن دیگر هم در اين حين فرصت بيشترى براى فكر كردن پيدا مى كند، و او خودسرانه گزينه اشتباه را انتخاب مى كند. این ایده به صورت محدود توسط برنامه های تخته نرد مورد استفاده قرار گرفته است. به عنوان مثال، TD-Gammon تمام اقدامات قانونی را ارزیابی می کند و تعداد کمی را به عنوان گزينه پيشنهادى برای ارزیابی بیشتر انتخاب می کند. اینها ارزیابی یک مرحله ای را انجام می دهند. یک ارزیابی بسیار درجه بندی شده تر از هر دو معقول و مطلوب تر است، ممکن است یک موقعيت حمله باشد. به عنوان مثال، ممكن است بازيكنى با ارزیابی سریع از همه موقعیت ها با یک ارزیاب خطی فقط با چند ویژگی (خوب، <50) ایجاد شده، اولین کاهش را به وجود آورد. سپس ارزیابى كامل (با
شاید برخی از ویژگیهای اضافی و پیچیده تر) اعمال شود. اگر وضعیت هنوز نامشخص است، بازيكن بايد یک بازى را در نظر بگيرد، و سپس به دو بازى نگاه کند، البته اين در صورتى است كه برنامه به اندازه کافی سریع باشد. این رویکردی است که من امیدوارم اجرا کنم، زیرا می خواهم برنامه ام این کار را انجام دهد و هر دو خوب باشند ( اين نياز به ارزیابی زیادی از گزينه پيشنهادى دارد) و بسیار سریع. به نظر نمى آيد كه شخص دیگری روی این نوع موضوع قبلاً کار کرده باشد.
از بین بردن حرکت موضوعی
روشی که اغلب در تخته نرد توصیف می شود به شرح زیر است: پس از به دست آوردن ليستى از حرکتهای اولیه گزينه هاى پيشنهادى، آنها را به صورت موضوعى گروه بندى كنيد، بهترین ها را از بین هر یک انتخاب كنيد، سپس از بین این گزينه هاى برنده انتخاب کنید. ایده این است که گزينه هايى از نظر موضوعی مشابه هم هستند را می توان با دقت بیشتری مقایسه کرد، در نتيجه انتخاب بهترین حرکت برای آن نسبتاً آسان است. با اين حال باید حركت نهايى را انتخاب كرد، اما حداقل یکی مشکل را کاهش داده است. همچنین، بازيكن امیدوار است که هر گونه خطا در انتخاب بهترین گزينه برای هر موضوع، نسبت به خطای احتمالی بدست آمده كوچك باشد. اگرچه اجرای آن دشوار است، اما من این باور را دارم این روش می تواند سود زیادی برای رایانه های شخصی و بازیکنان تخته نرد بياورد. حرکت گروه بندی از نظر موضوعی پیش پا افتاده نيست، اما ایده اصلی واضح است: حرکات گروهی ضربه می زنند، باعث ایجاد یک امتياز در تخته داخلی می شوند، و یک گره و یک لنگر پیشرفته ایجاد می كنند.