بر هوشی که میتواند بهتر از دیگر انواع این فناوری بیاموزد و این الگوریتم اکنون از توانایی آموزش دادن صحبت کردن به خود برخوردار است.
براساس گزارش ساينس الرت، اكنون محققان در اين موسسه موفق شدهاند اين سيستم را به گونهاي ارتقا دهند كه بتواند مانند انسانها از خطاهاي خودش بياموزد.
اين توانايي مديون الگوريتم منبع بازي به نام HER (مخفف شناخت تكرار تجربه) است كه محققان به تازگي آن را ايجاد كردهاند و همانطور كه از نامش مشخص است، به سيستم امكان ميدهد خطاهاي خود را بازبيني كرده و از آنها براي انجام درست وظيفه جديد درس بگيرد. از اين رو هوش مصنوعي خطاهاي خود را به عنوان موفقيت درنظر ميگيرد.
به بياني ديگر، هر تلاش خطايي كه اين سيستم هوش مصنوعي در مسير انجام يك دستور انجام ميدهد، به هدفي ديگر تبديل ميشود، هدفي ناخواسته و مجازي. درست مانند اولين تجربه يادگيري دوچرخهسواري كه در آن فرد ابتدا در حفظ تعادل دچار مشكل ميشود. هر بار زمين افتادن فرد را به هدفش كه حفظ تعادل است نزديكتر ميسازد زيرا بشر به اين شكل و با استفاده از خطاهايش ميآموزد.
با استفاده از HER، اين سيستم هوش مصنوعي نيز قصد دارد به شيوهاي مشابه كارهاي جديد را يادبگيرد. اين تكنيك به تدريج جايگزين سيستم پاداشي خواهد شد كه در مدلهاي يادگيري تقويت يادگيري مورد استفاده قرار ميگيرند. براي اينكه يك هوش مصنوعي به خودش درس بدهد، بايد از سيستم پاداشي استفاده كند، سيستمي كه متناسب با رسيدن يا نرسيدن هوش مصنوعي به هدفش به آن جايزه ميدهد.
اين مدل كامل نيست و برخلاف آن سيستم HER حتي زماني كه هوش مصنوعي دچار خطا ميشود نيز به او پاداش ميدهد. به اين شكل سيستم با سرعت و كيفيت بالاتري ياد ميگيرد. به گفته محققان استفاده از سيستم جديد يادگيري به آن معني نيست كه ياد دادن كارهاي ويژه به هوش مصنوعي سادهتر از گذشتهاست. حقيقت يادگيري با استفاده از HER در روباتهاي واقعي هنوز فرايند پيچيدهاي است زيرا به دريايي از نمونهها نياز دارد.