هوش مصنوعی چیست؟
هوش مصنوعی (AI) تکنولوژی ای هست که به کامپیوترها و ماشین ها این قابلیت رو میده که مثل انسان یاد بگیرن، درک کنن، مسائل رو حل کنن، تصمیم بگیرن، خلاقیت داشته باشن و به صورت مستقل عمل کنن.اپلیکیشن ها و دستگاه هایی که به هوش مصنوعی مجهز هستن، میتونن اشیا رو ببینن و شناسایی کنن. میتونن زبان انسان رو درک کنن و بهش پاسخ بدن. میتونن از اطلاعات جدید و تجربه ها یاد بگیرن. میتونن به کاربران و متخصص ها پیشنهادهای دقیق ارائه بدن. حتی میتونن به طور مستقل عمل کنن و جایگزین نیاز به هوش یا مداخله انسانی بشن (مثلا یه نمونه معروف، ماشین های خودران هستن).اما در سال 2024، بیشتر محقق ها و فعال های حوزه هوش مصنوعی - و همینطور تیترهای خبری در این زمینه - روی پیشرفت های هوش مصنوعی مولد (Gen AI) تمرکز دارن. این تکنولوژی میتونه متن، تصویر، ویدیو و انواع محتوای جدید و اورجینال تولید کنه. برای درک بهتر هوش مصنوعی مولد، اول باید تکنولوژی هایی که این ابزارها بر اساسشون ساخته شدن رو شناخت: یادگیری ماشین (ML) و یادگیری عمیق.
یادگیری ماشین
یک روش ساده برای درک هوش مصنوعی اینه که اون رو به عنوان مجموعه ای از مفاهیم تو در تو یا مشتق شده ببینیم که در بیش از 70 سال گذشته شکل گرفتن.
در زیر مجموعه هوش مصنوعی، یادگیری ماشین (Machine Learning - ML) قرار داره که شامل ایجاد مدل هایی هست که از طریق آموزش یه الگوریتم روی داده ها، یاد میگیرن که پیش بینی یا تصمیم گیری کنن. این حوزه طیف گسترده ای از تکنیک ها رو شامل میشه که به کامپیوترها امکان میده بدون اینکه به طور صریح برای انجام یک وظیفه خاص برنامه نویسی بشن، از داده ها یاد بگیرن و نتیجه گیری کنن.
انواع یادگیری ماشین
الگوریتم های یادگیری ماشین انواع مختلفی دارن، از جمله: رگرسیون خطی، رگرسیون لجستیک، درخت تصمیم، جنگل تصادفی، ماشین بردار پشتیبان (SVM)، نزدیک ترین همسایه (KNN)، خوشه بندی و بسیاری روش های دیگه. هر کدوم از این روش ها برای حل مسائل و داده های خاصی مناسب هستن.اما یکی از محبوب ترین انواع الگوریتم های یادگیری ماشین، شبکه عصبی (Neural Network) یا شبکه عصبی مصنوعی هست. شبکه های عصبی از ساختار و عملکرد مغز انسان الهام گرفته شدن. این شبکه ها از لایه های متصل به هم از گره ها (که شبیه به نورون های مغز عمل میکنن) تشکیل شدن و به صورت یکپارچه روی داده های پیچیده پردازش انجام میدن. شبکه های عصبی برای تشخیص الگوهای پیچیده و روابط بین حجم زیادی از داده ها بسیار مناسب هستن.
یادگیری ماشین نظارت شده
ساده ترین نوع یادگیری ماشین، یادگیری نظارت شده (Supervised Learning) نام داره. در این روش، مدل با استفاده از مجموعه داده هایی که دارای برچسب های مشخص هستن، آموزش داده میشه تا بتونه داده های جدید رو طبقه بندی کنه یا نتایج رو پیش بینی کنه. در یادگیری نظارت شده، انسان برای هر نمونه آموزشی یک برچسب خروجی تعیین میکنه. هدف اینه که مدل، رابطه بین ورودی و خروجی های داده های آموزشی رو یاد بگیره، تا بعدا بتونه خروجی داده های جدید و دیده نشده رو با دقت پیش بینی کنه.
یادگیری عمیق
یادگیری عمیق (Deep Learning) یکی از زیرمجموعه های یادگیری ماشین هست که از شبکه های عصبی چندلایه استفاده میکنه. این شبکه ها که بهشون شبکه های عصبی عمیق (Deep Neural Networks) میگن، قدرت تصمیم گیری پیچیده مغز انسان رو بهتر شبیه سازی میکنن.
ساختار شبکه های عصبی عمیق
برخلاف شبکه های عصبی معمولی که در مدل های کلاسیک یادگیری ماشین استفاده میشن و معمولاً فقط یک یا دو لایه مخفی دارن، شبکه های عصبی عمیق از:
- یک لایه ورودی
- حداقل سه لایه مخفی (و در بسیاری از موارد، صدها لایه)
- یک لایه خروجی
تشکیل شدن.
ویژگی های یادگیری عمیق
این لایه های متعدد باعث میشن که یادگیری بدون نظارت (Unsupervised Learning) امکان پذیر بشه. مدل های یادگیری عمیق میتونن ویژگی های مهم رو به صورت خودکار از داده های حجیم، بدون ساختار و بدون برچسب استخراج کنن و بر اساس اونها پیش بینی هایی انجام بدن.
کاربردهای یادگیری عمیق
چون یادگیری عمیق نیازی به مداخله انسانی نداره، این تکنولوژی مقیاس عظیمی از یادگیری ماشین رو امکان پذیر میکنه. یادگیری عمیق برای پردازش زبان طبیعی (NLP)، بینایی کامپیوتری (Computer Vision) و سایر وظایفی که نیاز به شناسایی سریع و دقیق الگوهای پیچیده در حجم زیادی از داده دارن، بسیار مناسبه.امروزه، بیشتر اپلیکیشن های هوش مصنوعی که در زندگی روزمره باهاشون سر و کار داریم، به نوعی از یادگیری عمیق استفاده میکنن.
هوش مصنوعی مولد
هوش مصنوعی مولد که گاهی بهش Gen AI هم میگن، به مدل های یادگیری عمیق اشاره داره که میتونن محتوای جدید و پیچیده ای مثل متن های طولانی، تصاویر با کیفیت بالا، ویدیوهای واقعی، صدا و موارد دیگه رو در پاسخ به درخواست یا ورودی کاربر تولید کنن.در سطح بالا، مدل های مولد یک نمایش ساده شده از داده های آموزشی خودشون رو رمزگذاری میکنن و بعد از اون نمایش استفاده میکنن تا محتوای جدیدی تولید کنن که مشابه داده های اصلی هست اما دقیقا یکسان نیست.مدل های مولد سال ها در آمار برای تحلیل داده های عددی استفاده میشدن اما در دهه گذشته پیشرفت کردن و تونستن داده های پیچیده تری رو تحلیل و تولید کنن. این پیشرفت با ظهور سه مدل پیشرفته یادگیری عمیق همراه شد:
- رمزگذار خودکار تغییریافته (Variational Autoencoders - VAEs) که در سال 2013 معرفی شد و به مدل ها این امکان رو داد که چندین نسخه متفاوت از محتوا رو در پاسخ به ورودی یا دستور کاربر تولید کنن.
- مدل های انتشار (Diffusion Models) که اولین بار در 2014 دیده شدن. این مدل ها نویز رو به تصاویر اضافه میکنن تا غیرقابل تشخیص بشن و بعد اون نویز رو کم کم حذف میکنن تا تصویر جدیدی ایجاد کنن که به درخواست کاربر مرتبط باشه.
- ترانسفورمرها (Transformers) که روی داده های دنباله دار آموزش میبینن و میتونن دنباله های طولانی از محتوا رو تولید کنن مثل کلمات در یک جمله، اشکال در یک تصویر، فریم های یک ویدیو یا دستورات در کد نرم افزاری.
ترانسفورمرها هسته اصلی بیشتر ابزارهای هوش مصنوعی مولد امروزی هستن از جمله ChatGPT و GPT-4، Copilot، BERT و Midjourney .