هوش مصنوعی از اواسط قرن بیستم مورد توجه جدی دانشمندان و سرمایهگذاران قرار گرفت؛ اما نتایجِ به دست آمده از تحقیقات و پژوهشهای کلان، با پیشبینیهای خوشبینانه و انتظارات فزایندهی آنان فاصلهی زیادی داشت. این شکست، سرانجام پس از مدت کوتاهی و در اواخر قرن بیستم منجر به فروپاشی صنایع وابسته و قطع بودجههای پژوهشی در این حوزه شد. این شرایط که حدود سه دهه ادامه داشت بعدها به زمستان هوش مصنوعی مشهور شد. آنچه در درخت هوش مصنوعی میبینید مروری بر ابداعات و ابتکاراتی است که در قرن بیست و یکم، هوش مصنوعی را از زمستان خود به بهاری پربار رسانده است.
یادگیری ماشین مجموعهای از روشهای گوناگون است که کامپیوترها را قادر میسازد از دادهها بیاموزند و بر اساس آموختههایشان تصمیم بگیرند. این آموختهها شامل الگوها و روابط پیچیدهای است که در حجم انبوهی از دادهها وجود دارند، ولی به وضوح قابلتشخیص نیستند.کامپیوترها قادر خواهند بود بدون دخالت انسان این الگوها را یاد بگیرند و از آنها برای حل مسائلی استفاده کنند که تا به حال با آنها مواجه نشده اند. کامپیوتر در واقع با پردازش دادهها، به یک بازنمایی یا مدل از آنها دست مییابد.
محصولات مبتنی بر این مدلها را در همه جا میتوان مشاهده کرد؛ از سیستمهای پیشنهاددهندهی فیلم و موسیقی گرفته تا دوربینهای خوانش پلاک ماشین، نرمافزار تبدیل متن به صوت و عامل هوشمند تشخیص سرطان.
یادگیری بانظارت یک الگوی پرکاربرد در یادگیری ماشین است که از دادههای دارای ویژگی هدف یا برچسب استفاده میکند. هدف یادگیری بانظارت، ساخت مدلی است که با بررسی ویژگیهای مختلف یک داده، برچسب آن را پیشبینی کند. برای مثال در مسئلهی تشخیص هرزنامه، متن نامههای الکترونیک به دو دستهی هرزنامه و غیرهرزنامه تقسیم شدهاند و برچسب مشخصی دارند. با وجود این برچسبها مشاهدهی روند یادگیری و کاهش خطای پیشبینی امکانپذیر است.
یکی از کاربردهای مهمِ یادگیری بانظارت، طبقهبندی دادهها در قالب دستههای از پیش تعیینشده است. به طور مثال از طریق این روش میتوان هرزنامه بودن یا نبودنِ ایمیلها را تشخیص داد، یا تعیین کرد که بازخورد نوشتاری یک مشتری نسبت به یک محصول مثبت، منفی یا خنثی بوده است. کامپیوتر با یادگیری الگوهای مربوط به دادههای هر طبقه، قادر خواهد بود طبقهی نمونههایی را نیز پیشبینی کند که تاکنون با آنها روبرو نشده بوده است.
سیستمهای پیشنهادگر سعی میکنند با تحلیل سلیقه و تاریخچهی رفتار شما، مناسبترین اقلام (کالا، موسیقی، فیلم و غیره) را به شما پیشنهاد دهند. یک گام مهم در این سیستمها «تشخیص شباهت» میان سلیقهی کاربران مختلف و همچنین میان اقلام مختلف است، که الگوریتمهای یادگیری ماشین عملکرد خوبی در آن دارند. یک نمونهی خوب از پیادهسازی این الگوریتمها، دیجیکالا است؛ صفحه اصلی با توجه به تاریخچهی خریدها و تعاملات شما شخصیسازی شده و کالاهای مشابهی به شما پیشنهاد میشوند. همچنین در صفحهی مخصوص هر کالا، دیگر کالاهای مشابه از نظر تصویری و یا متنی، قابل مشاهده هستند.
تصویر مقابل دو نوع اصلی سیستمهای پیشنهادگر را نشان میدهد. در نوع اول، یعنی «پالایش مشارکتی»، افراد همسلیقه با شما، بهوسیلهی بررسی تاریخچهی شما پیدا میشوند، سپس کالاهایی که افراد همسلیقه با شما خریدهاند به شما پیشنهاد میشود. در نوع دوم، یعنی «پالایش محتوایی»، با توجه به ویژگیهای ظاهری و مشخصات کالاها، کالاهای مشابهِ اقلام خریداریشدهی قبلی کاربر، مشخص شده و همراه با کالای اصلی مشخصشدهی کاربر به او نمایش داده میشوند.
در الگوی یادگیری بدون نظارت، از دادههایی استفاده میشود که دارای ویژگی هدف یا برچسب مشخصی نیستند. اکثر دادههای موجود در جهان چنین شکلی دارند. هدف این الگو به جای پیشبینی در مورد هر داده، استخراج اطلاعات و الگوهای مخفی موجود در دادههاست. این الگوها و اطلاعات به تحلیلگران در تصمیمگیری و ساخت مدلها بسیار کمک میکنند. دو مسئلهی مهم در یادگیری بدون نظارت، خوشهبندی و کاهش ابعاد است.
خوشهبندی یکی از کاربردهای یادگیری بدون نظارت است که دادهها را به دستهها یا خوشههای مختلفی تقسیم میکند، به طوری که دادههای موجود در یک خوشه، مشابه همدیگر باشند. برای مثال در ویرایش یک تصویر، پیکسلها به خوشههایی دارای بافت و رنگ یکسان تقسیم میشوند. یا مثلا در دیجیکالا، به زودی کاربران بر اساس تاریخچهی خرید و تعاملاتشان خوشهبندی خواهند شد تا تجربهی خرید بهتری داشته باشند. در بعضی از الگوریتمهای خوشهبندی تعداد خوشهها از پیش مشخص میشود و در بعضی الگوریتمها تعداد خوشهها توسط کامپیوتر تشخیص داده میشود.
در الگوی یادگیری تقویتی، کامپیوتر با دریافت پاداش و تاوان آموزش میبیند. در تعامل با یک محیط شبیهسازی شده و با قرار گرفتن در وضعیتهای متفاوت، کامپیوتر تصمیمهای پیدرپی میگیرد و بر اساس نتیجهی تصمیمات و پاداش و تاوان دریافتی از محیط، دانش خود را بهبود میبخشد. این الگو با موفقیت در ساخت عاملهای هوشمند در بازیها به کار رفته است و آیندهی بسیار امیدبخشی برای آن پیشبینی میشود.
شبکهی عصبی مصنوعی مدلی از یادگیری ماشین با الهام از ساختار مغز است. بین نورونهای مغز انسان اتصالات پیچیدهای وجود دارد که امکان ذخیرهسازی و پردازش اطلاعات را فراهم میکنند. به همین ترتیب در مدل شبکهی عصبی نیز ساختاری پیچیده وجود دارد که از واحدهایی با نام مشابه تشکیل شده است و قدرت محاسباتی و یادگیری بالایی را به وجود میآورد. در شبکههای عصبی، اطلاعات به صورت ساختارمند از نورونهای ورودی به نورونهای خروجی جریان مییابد و طی این فرآیند، پردازش و تفسیر این اطلاعات صورت میپذیرد.
فرایند یادگیری در این شبکهها با تقویت یا تضعیفِ اتصالات بین دو نورون رخ میدهد. قدرت و کارایی این مدل به حدی بالا است که یکی از بهترین راهحلها برای طیف گستردهای از مسائل محسوب میشود. مسائلی مانند تشخیص محتوای یک تصویر، تبدیل گفتار به متن، خواندن اعداد دستنوشته و دیگر مسائل پیچیده از جملهی آنها هستند.
شبکههای عصبیِ پیچشی یکی از قویترین ابزارها برای پردازش تصویر و تشخیص الگو هستند. این شبکهها یاد میگیرند با اِعمال فیلترهای مختلف، ابتدا ویژگیهایی ساده مثل لبهها و بافت را از تصویر استخراج کنند. سپس در لایههای بالاتر، از این ویژگیها برای کارهای پیچیدهتری مثل شناسایی اشیا و حتی تولید تصاویر جدید استفاده کنند. این شبکهها نقشی اساسی در موفقیت فناوریهایی همچون تشخیص چهره و ماشینهای خودران داشته اند.
یک تصویر دیجیتال از دید کامپیوتر، صرفا شامل مقادیر عددی رنگ پیکسلها است. بینایی ماشین شاخهای است که به کامپیوتر اجازه میدهد درک عمیقتری از این اعداد پیدا کند و اطلاعاتی مانند اشیای درونِ تصویر را استخراج کند؛ برای مثال در دیجیکالا، کاربران به زودی خواهند توانست با ارسال یک تصویر، کالاهای مشابه آن را از میان هزاران کالا پیدا کنند. شبکههای عصبی عمیق در پیشرفت این حوزه نقش بهسزایی داشتهاند. با این حال به علت نیاز به دادههای زیاد در این شاخه، فراهم کردن میلیونها تصویر با برچسب مناسب، همواره یک چالش بزرگ بوده است.
تشخیص اشیا یکی از مسائل حوزهی بینایی ماشین است که هدف آن تشخیص و مکانیابی اشیای موردنظر در تصویر یا ویدیو است. مرحلهی اولیهی این مسئله، شناسایی موقعیت و مرزهای هر یک از اشیا و سپس طبقهبندی آنها در دستههای مختلف است. اکثر مدلهای موفقِ تشخیص اشیا از شبکههای عصبی به خصوص شبکهی عصبی پیچشی استفاده میکنند.
پردازش زبان طبیعی، شاخهای میانرشتهای بین هوش مصنوعی و زبانشناسی است. هدف آن ساخت سیستم ایدهآلی است که زبان طبیعی انسان را با تمام پیچیدگیهای آن درک کند و با تشخیص ساختارهای زبانی و استخراج اطلاعات مهم از متن، پاسخ مناسبی به مسائل ارائه دهد. طی هفتاد سال اخیر هستهی این سیستمها از مجموعهی بزرگی از قواعد زبانیِ دستنوشته به مدلهای یادگیری ماشین تغییر یافتهاند.
ترجمهی ماشینی به فرایند ترجمهی یک متن به کمک نرمافزار گفته میشود. این فرایند در گذشته بر اساس قواعد دستنوشته انجام میشد و دقت پایینی داشت. سپس روشهای آماری رونق گرفتند که با یادگیری از متنهایی در هر دو زبان مبدا و مقصد، یک ترجمهی احتمالی برای عبارت ورودی تولید میکردند. در سالهای اخیر روشهای مبتنی بر شبکههای عصبی، به دلیل توانایی بهتر در یادگیری الگوهای پیچیده و ترجمههای بهتر، از همهی روشها پیشی گرفتهاند.
تحلیل احساسات یک شاخهی پرکاربرد در حوزهی پردازش زبان طبیعی است که هدف آن تشخیص احساسات موجود در متن و بیان آنها در قالب مقادیر عددی است. از مهمترین کاربردهای این شاخه، تحلیل بازخورد مشتریها در کسبوکارهای آنلاین است؛ برای مثال در دیجیکالا روزانه هزاران نظر مختلف برای کالاهای گوناگون ثبت میشود که بررسی تکتک آنها کار زمانبری است. به کمک تحلیل احساسات، به طور خودکار نظرات مفید از غیر مفید جدا میشوند و فرآیند بررسی، سرعت بالایی پیدا میکند.