فرض کنيد که n نفر شکارچي کل جمعيت يک جامعه را تشکيل مي دهند. اين شکارچيان هر روز به شکار مي روند و در آخر شب شکار خود را به دهکده بر مي گردانند. بعضي شکارها مثلا شکار گوزن نياز به همکاري چند شکارچي با هم دارد و بعضي ديگر نه. فرض کنيد که F مقدار کل شکار همه شکارچي ها در آخر شب باشد و Fj مقدار شکار شکارچي jام. يعني F=F1+F2+...+Fn
سود عمومی. هر کس به اندازه توانش زحمت مي کشد و هر کس به اندازه نيازش استفاده مي کند. يعني مقدار F را به تساوي بين همه شکارچيان تقسيم کنيم. اتفاق بدي در اين حالت مي افتد. همه شکارچيان عين هم نيستند، بعضي تنبل تر و بعضي کوشا ترند. در اين اقتصاد تنبل ها تشويق مي شوند که کمتر کار کنند و برآيند کل اقتصاد جامعه پايين مي آيد. به همين ترتيب، کوشاها انگيزه خود را براي تلاش بيشتر از دست مي دهند، چون حاصل تلاش خود را بايد با طبقه تنبل به طور مساوي تقسيم کنند. (اين اقتصاد مرا آزار مي دهد)
سود فردی. هر کس به اندازه کوشا بودنش سود مي برد. يعني به فرد j ام مقدار Fj خواهد رسيد. در اين حالت نيز اتفاق بدي مي افتد. افراد ترغيب به حريص بودن مي شوند و همکاري اجتماعي پايين مي آيد. البته به نظر من در دراز مدت همانند يک بازي تکرار شونده اين مشکل بر طرف خواهد شد.
بینابین. هر فرد هم سهم در درآمد کل جامعه و هم سهم در درآمد خود دارد. دو عدد c,d بين صفر و يک مشخص مي شود که c+nd=1. شکارچي jام به مقدار c.Fj+d.F سهم گوشت خواهد برد.
با توجه به نوع محیط چندعاملی مقدار c,d باید معین گردد تا کارایی کل سیستم بالا رود.
سود عمومی. هر کس به اندازه توانش زحمت مي کشد و هر کس به اندازه نيازش استفاده مي کند. يعني مقدار F را به تساوي بين همه شکارچيان تقسيم کنيم. اتفاق بدي در اين حالت مي افتد. همه شکارچيان عين هم نيستند، بعضي تنبل تر و بعضي کوشا ترند. در اين اقتصاد تنبل ها تشويق مي شوند که کمتر کار کنند و برآيند کل اقتصاد جامعه پايين مي آيد. به همين ترتيب، کوشاها انگيزه خود را براي تلاش بيشتر از دست مي دهند، چون حاصل تلاش خود را بايد با طبقه تنبل به طور مساوي تقسيم کنند. (اين اقتصاد مرا آزار مي دهد)
سود فردی. هر کس به اندازه کوشا بودنش سود مي برد. يعني به فرد j ام مقدار Fj خواهد رسيد. در اين حالت نيز اتفاق بدي مي افتد. افراد ترغيب به حريص بودن مي شوند و همکاري اجتماعي پايين مي آيد. البته به نظر من در دراز مدت همانند يک بازي تکرار شونده اين مشکل بر طرف خواهد شد.
بینابین. هر فرد هم سهم در درآمد کل جامعه و هم سهم در درآمد خود دارد. دو عدد c,d بين صفر و يک مشخص مي شود که c+nd=1. شکارچي jام به مقدار c.Fj+d.F سهم گوشت خواهد برد.
با توجه به نوع محیط چندعاملی مقدار c,d باید معین گردد تا کارایی کل سیستم بالا رود.
۵ نظر:
من فکر میکنم در سیستمهای چند عاملی که پاداش به نوعی در گلوگاه قرار دارد، اختصاص پاداش محلی موجب رقابت میان عاملهای همکار میشود، و در مقابل در سیستمهای چندعاملی که پاداش در چندین هدف مختلف قرار گرفته است، به طوری که تعداد اهداف بیشتر از تعداد عاملهاست، اختصاص پاداش عمومی موجب تنبل شدن عاملها میشود.
در صفحه 8 از (1) بخشی به تخصیص اعتبار اختصاص داده شده است. من فکر میکنم اجتماع آدمها شباهت زیادی به سیستمهایی دارد که در آنها چندین هدف و چندین پاداش وجود دارد و پاداش در آن گلوگاه نیست. مثلاً یک قصاب، یا یک بقال، یا یک تاجر هر کدام درآمد خود را دارند. تفاوت دیگر سیستمهای اجتماعی با مسئلهی یادگیری تقویتی این است، که در سیستمهای اجتماعی، مردم علاوه بر کنشهایی که انجام میدهند، خود میتوانند به دیگر عاملها (دیگر مردم) پاداش دهند. مثلاً یک کارگر رستوران از دست یک عامل انعام میگیرد، یا یک بازیکن مدافع ممکن است به خاطر عملکرد خوبش توسط عاملی که گل زده مورد تشویق قرار گیرد. در صورتی که در یک مسئله یادگیری تقویتی پاداش از محیط دریافت میشود، یعنی یک کارگر رستوران باید برود از دولت انعامش را بگیرد!
برای همین من فکر میکنم برای این که بخواهیم عمکرد دو نوع اقتصاد کمونیستی و سرمایهداری را باهم مقایسه کنیم، چهارچوب یادگیری تقویتی کافی نباشد؛ و لازم است کنشهای قابل انجام عاملها را به کنشهای تخصیص اعتبار به دیگر عاملها نیز گسترش دهیم. مثلاً به شکارچی این امکان را بدهیم که «یاد بگیرد» درصدی از گوشت شکار را به همکارش که تنها مراقب اوضاع اطراف بوده ببخشد و در انتها ببینیم که آیا این درصد صفر بوده یا نه.
پ.ن. کاگان تیومر (2) کارهای زیادی در رابطه با تخصیص اعتبار در یادگیری تقویتی انجام داده است.
(1) Panait, L. and Luke, S., "Cooperative multi-agent learning: The state of the art," Autonomous agents and multi-agent systems, pp.383–434, 2005
Link: cs.gmu.edu/~eclab/papers/panait05cooperative.pdf
(2) Kagan Tumer,
homepage: http://engr.oregonstate.edu/~ktumer
سلام من نازنین توانا دانشجوی منطق دانشگاه امیرکبیر هستم. می خواستم بپرسم شما این ترم درس سیسنم های اجتماعی را ارائه می دهید یا خیر؟ ممنون
nazanin.tavana@gmail.com
سيناي عزيز، خيلي ممنون از توضيحات و مراجع.
نازنين عزيز، نه. اما به اين فکرم که شايد ترم پاييز درس هوش مصنوعي توزيع شده بدهم.
ممنون می شوم که درسهایی که این ترم درس می دهید را بگویید. احتمال اینکه این درس را ارائه بدهید چه ترمی است؟ ممنون از لطف شما
هوش مصنوعي (کارشناسي) و پيچيدگي محاسبه
ارسال یک نظر