هوش مصنوعی (AI) بر ایجاد ماشین‌های هوشمندی تاکید دارد که مانند انسان‌ها کار می‌کنند و واکنش نشان می‌دهند. هوش مصنوعی از یادگیری ماشینی استفاده می‌کند تا مانند انسان عمل کند. کامپیوتر باید یاد بگیرد که چگونه به اقدامات خاصی پاسخ دهد، بنابراین از الگوریتم‌ها برای پیش‌بینی استفاده می‌ کند.

همشهری آنلاین - یکتا فراهانی: یادگیری ماشینی یکی از مهم‌ترین فناوری‌های هوش مصنوعی است. این فناوری به ماشین اجازه می‌دهد تا بر الگوریتم خاصی از یادگیری کار کند؛ بدون اینکه به طور واضح دستورالعمل‌های تعریف شده را به آنها ارائه دهد. برنامه مبتنی بر هوش مصنوعی یادگیری ماشین برای تصمیم‌گیری با توانایی تشخیص روابط با داده‌های موجود طراحی شده است.

تکنیک خودسازی

خودسازی تکنیکی برای بهبود عملکرد عوامل یادگیری تقویتی است. به طور شهودی، عوامل یاد می‌گیرند که عملکرد خود را با بازی‌کردن در برابر خودشان بهبود بخشند.
همه شاخه‌های هوش مصنوعی بر یک ایده اصلی متکی هستند: تقلید از هوش انسانی، استفاده از قوانین، منطق یا رویکرد مبتنی بر دانش. ML با یادگیری الگوها از داده‌ها فراتر می‌رود و DL از طریق یک شبکه عصبی مصنوعی که مغز انسان را تقلید می‌کند، یاد می‌گیرد.

مشکل هوش مصنوعی با تفکر انسان

هوش مصنوعی مشکل بزرگی با حقیقت و درستی دارد و به نظر می رسد تفکر انسان بخش بزرگی از این مشکل است. در حال حاضر نسل جدیدی از هوش مصنوعی شروع به اتخاذ رویکرد آزمایشی کرده است که می تواند یادگیری ماشینی را از انسان ها دور کند.
AlphaGo شرکت Deepmind پیشرفت خوبی در توسعه هوش مصنوعی دارد. چون یکی از اولین هوش مصنوعی های بازی بود که هیچ دستورالعمل انسانی را دریافت نکرد و قوانینی را هم نخواند.

بیشتربخوانید :
ظهور ابرهوش مصنوعی در دهه آینده

چند روش برای تقویت ضریب هوشی | باهوش نمی‌شوید، اما ...

تلاش برای یادگیری

در عوض، از تکنیکی به نام یادگیری تقویتی خودبازی (RL) برای ایجاد درک خود از بازی استفاده کرد. آزمون و خطای محض در میلیون‌ها، حتی میلیاردها بازی مجازی، شروع کم‌وبیش تصادفی با کشیدن اهرم‌های موجود، و تلاش برای یادگیری از نتایج دارد.
در این مرحله، Deepmind مدل مشابهی از AlphaZero را در دنیای شطرنج راه‌اندازی کرد، جایی که مدل‌هایی مانند Deep Blue که روی تفکر انسان، دانش و مجموعه قوانین آموزش‌دیده بودند، از دهه ۹۰ استاد بزرگ‌های انسانی را شکست داده بودند.
آلفا زیرو ۱۰۰ مسابقه را مقابل قهرمان فعلی هوش مصنوعی، Stockfish انجام داد که ۲۸ بازی را برد و بقیه را به‌تساوی کشاند.

ترمز هوش مصنوعی در مقابل تفکر انسان

Deepmind شروع به تسلط بر این بازی‌ها - و شوجی، Dota ۲، Starcraft II و بسیاری دیگر کرد؛ هنگامی که این ایده را کنار گذاشت که تقلید از انسان بهترین راه برای به‌دست‌آوردن یک نتیجه خوب است.
در واقع به ذهن‌های الکترونیکی این آزادی داده شد تا با شرایط خاص خود با موضوعات تعامل داشته باشند، با نقاط قوت شناختی‌شان بازی کنند و درک اساسی خود را از آنچه کار می‌کند و چه چیزی مفید است بسازند

AlphaZero مانند مگنوس کارلسن شطرنج نمی‌داند و روش‌های کاربردی استادان بزرگ را مطالعه نکرده است. او فقط شطرنج‌بازی کرده است. اما نتیجه آن بهتر از هر مدلی است که توسط انسان‌ها آموزش‌داده‌شده است. اما اگر یک عامل یادگیری تقویتی پیشرفته در طرف دیگر وجود داشته باشد. هیچ انسان و هیچ مدلی که بر اساس تفکر انسانی آموزش‌دیده باشد، شانسی در بازی شطرنج نخواهد داشت.

جدا شدن از تفکر بشری

ChatGPT و هوش مصنوعی‌های دیگر مدل زبان بزرگ (LLM)، مانند هوش مصنوعی‌های اولیه شطرنج، بر دانش بشری به‌اندازه موجود آموزش‌دیده و خیلی خوب شده‌اند.

اما نگرانی‌هایی هم وجود دارد در مورد اینکه آیا آنها هرگز به هوش عمومی مصنوعی دست خواهند یافت یا نه. به گزارش سایت Humanoids، LLM ها در زبان تخصص دارند؛ نه در درست یا غلط‌گرفتن حقایق.

زبان مجموعه‌ای از مناطق خاکستری عجیب‌وغریب است که به‌ندرت پاسخی ۱۰۰ درصد درست یا غلط وجود دارد. بنابراین LLM ها معمولاً با استفاده از یادگیری تقویتی با بازخورد انسانی آموزش می بینند. یعنی انسان‌ها انتخاب می‌کنند کدام پاسخ به نوع پاسخی که می‌خواستند نزدیک‌تر باشد. اما حقایق، امتحانات و کدنویسی یک شرط وجود دارد؛ اینکه موضوع را درست فهمیدی یا نه.
و اینجاست که مدل جدید o۱ شروع به جدا شدن از تفکر بشری و ارائه رویکرد دیوانه‌وار موثر AlphaGo نتیجه درست کرده است.

کودک o۱ وارد یادگیری تقویتی می‌شود

o۱ از بسیاری جهات، تقریباً مشابه نسخه‌های قبلی خود است؛ با این تفاوت که OpenAI قبل از شروع به پاسخ‌دادن به یک درخواست، «زمان فکری» را ایجاد کرده است. در طول این زمان تفکر، o۱ یک «زنجیره فکر» ایجاد می‌کند که در آن راه خود را از طریق یک مشکل در نظر می‌گیرد و استدلال می‌کند.
و اینجاست که رویکرد RL وارد می‌شود. o۱، برخلاف مدل‌های قبلی که بیشتر شبیه پیشرفته‌ترین سیستم‌های تکمیل خودکار جهان بودند، واقعاً اهمیت می‌دهد که همه چیز را درست انجام دهد.

توصیف حقیقت در دنیای فیزیکی

o۱ هنوز باتوجه‌به زبان انسان آموزش‌دیده است. این با حقیقت بسیار متفاوت است. در واقع زبان یک بازنمایی خام و کم وضوح از واقعیت است. مثلاً می‌توان درباره یک بیسکویت چیزهایی زیادی گفت و آن را توصیف کرد. اما تا زمانی که طعم آن را نچشیده‌ باشی نمی‌توانی درک درستی از آن داشته باشی؛ چیزی که در مورد هوش مصنوعی وجود دارد.


مسیر هوش مصنوعی به‌سوی حقیقت نهایی

هوش مصنوعی رویکردی عجیب به سبک آلفاگو برای درک جهان در پیش خواهد گرفته است. آن‌ها واقعیت را بررسی و نتایج را مشاهده می‌کنند، و تئوری‌های خودشان را به زبان خودشان دارند. در مورد اینکه چه چیزی کار می‌کند، چه چیزی خوب نیست، و چرا به وجود می‌آید.

آنها مانند انسان‌ها یا حیوانات به واقعیت نزدیک نمی‌شوند و از روش علمی مانند روش ما استفاده نمی‌کنند یا چیزها را به رشته‌هایی مانند فیزیک و شیمی تقسیم نمی‌کنند. همچنین همان آزمایش‌هایی را انجام نمی‌دهند که به انسان‌ها کمک می‌کند بر مواد و نیروها و منابع انرژی اطراف خود تسلط یابند و بر جهان تسلط پیدا کنند.

آن‌ها عجیب‌ترین کارهایی را که می‌توانید به آن‌ها فکر کنید، انجام می‌دهند، و با انجام این کارها، دانش جدیدی را ایجاد و کشف می‌کنند که انسان‌ها هرگز نمی‌توانستند آن‌ها را با هم جمع کنند.