این هوش مصنوعی از خطاهایش می‌آموزد

همشهری آنلاین: محققان موسسه OpenAI طی ماه‌های اخیر بر ایجاد هوش مصنوعی متمرکز بوده‌اند

بر هوشی که می‌تواند بهتر از دیگر انواع این فناوری بیاموزد و این الگوریتم اکنون از توانایی آموزش دادن صحبت کردن به خود برخوردار است.

براساس گزارش ساينس الرت، اكنون محققان در اين موسسه موفق شده‌اند اين سيستم را به گونه‌اي ارتقا دهند كه بتواند مانند انسان‌ها از خطاهاي خودش بياموزد.

اين توانايي مديون الگوريتم منبع بازي به نام HER (مخفف شناخت تكرار تجربه) است كه محققان به تازگي آن را ايجاد كرده‌اند و همانطور كه از نامش مشخص است، به سيستم امكان مي‌دهد خطاهاي خود را بازبيني كرده و از آنها براي انجام درست وظيفه جديد درس بگيرد. از اين رو هوش مصنوعي خطاهاي خود را به عنوان موفقيت درنظر مي‌گيرد.

به بياني ديگر، هر تلاش خطايي كه اين سيستم هوش مصنوعي در مسير انجام يك دستور انجام مي‌دهد، به هدفي ديگر تبديل مي‌شود، هدفي ناخواسته و مجازي. درست مانند اولين تجربه يادگيري دوچرخه‌سواري كه در آن فرد ابتدا در حفظ تعادل دچار مشكل مي‌شود. هر بار زمين افتادن فرد را به هدفش كه حفظ تعادل است نزديك‌تر مي‌سازد زيرا بشر به اين شكل و با استفاده از خطاهايش مي‌آموزد.

با استفاده از HER، اين سيستم هوش مصنوعي نيز قصد دارد به شيوه‌اي مشابه كارهاي جديد را يادبگيرد. اين تكنيك به تدريج جايگزين سيستم پاداشي خواهد شد كه در مدل‌هاي يادگيري تقويت يادگيري مورد استفاده قرار مي‌گيرند. براي اينكه يك هوش مصنوعي به خودش درس بدهد، بايد از سيستم پاداشي استفاده كند،‌ سيستمي كه متناسب با رسيدن يا نرسيدن هوش مصنوعي به هدفش به آن جايزه مي‌دهد.

اين مدل كامل نيست و برخلاف آن سيستم HER حتي زماني كه هوش مصنوعي دچار خطا مي‌شود نيز به او پاداش مي‌دهد. به اين شكل سيستم با سرعت و كيفيت بالاتري ياد مي‌گيرد. به گفته محققان استفاده از سيستم جديد يادگيري به آن معني نيست كه ياد دادن كارهاي ويژه به هوش مصنوعي ساده‌تر از گذشته‌است. حقيقت يادگيري با استفاده از HER در روبات‌هاي واقعي هنوز فرايند پيچيده‌اي است زيرا به دريايي از نمونه‌ها نياز دارد.