یادگیری ژرف یا Deep Learningیادگیری ژرف ماشین، یادگیری ساختار ژرف یا یادگیری سلسله مراتبی) یک زیر شاخه از یادگیری ماشینی و بر مبنای مجموعه‌ای از الگوریتم‌ها است که در تلاش هستند مفاهیم انتزاعی سطح بالا در دادگان را مدل نمایند که این فرایند را با استفاده از یک گراف عمیق که دارای چندین لایه پردازشی متشکل از چندین لایه تبدیلات خطی و غیر خطی هستند، مدل می‌کنند.

,

بررسی اجمالی Core ML فناوری یادگیری ماشین اپل

یادگیری ماشین به کمک CoreML

کور ام ال (CoreML) به شما این امکان را می دهد تا مدل های گوناگون یادگیری ماشین را در اپ خود ادغام کنید. علاوه بر پشتیبانی از یادگیری ژرف گسترده با بیش از ۳۰ نوع لایه٬ از مدل های استاندارد همانند گروه های درختی (Tree Ensembles)٬ اس وی ام ها (SVMs) و مدل های خطی تعمیم داده شده پشتیبانی می کند. به دلیل ساخته شدن آن روی تکنولوژی های سطح پایین مانند متال (Metal) و (Accelerate)٬ کور ام ال به طور یکپارچه از سی پی یو (CPU) و جی پی یو (GPU) برای فراهم کردن حداکثر کارایی استفاده می کند. شما می می توانید  روی دستگاه مدل های یادگیری ماشین اجرا کنید تا برای تجزیه و تحلیل داده نیاز به خروج آن از دستگاه نباشد.

نحوه عملکرد CoreML

دید Vision

شما به آسانی می توانید ویژگی های دید رایانه ای یادگیری ماشین را در اپ خود به کار به ببرید. ویژگی های پشتیبانی شده شامل رهگیری چهره٬ تشخیص چهره٬‌ نشان های اختصاصی و برجسته٬ تشخیص متن٬ تشخیص مستطیل٬ تشخیص بارکد٬ رهگیری اشیا و ثبت تصاویر است.

اشیای غالب در یک تصویر را از مجموعه ای از ۱۰۰۰ دسته مانند درخت ها٬ حیوانات٬ غذا٬ اتومبیل ها٬ مردم و غیره را تشخیص می دهد.

پردازش زبان طبیعی

ای پی آی های پردازش زبان طبیعی اساسا از یادگیری ماشین برای یادگیری ژرف(دیپ لرنینگ Deep Learning)  متن استفاده می کنند. آن ها از ویژگی هایی همچون تشخیص زبان٬ نشانه گذاری٬ اقسام کلمه و غیره استفاده می کند.

کارکردن با مدل ها

اپ های خود را با مدل های آماده برای استفاده ی کورام ال (CoreML) زیر بسازید و یا از ابزار کورام ال برای تبدیل آسان مدل ها به فرمت کورام ال استفاده کنید.

مدل ها

اسکویزنت (SqueezeNet)

اشیای غالب حاضر در یک تصویر را از مجموعه ای از ۱۰۰۰ دسته مانند درخت ها٬ جانوران٬ غذا٬ ابومبیل ها٬ مردم و غیره را تشخیص می دهد.

با اثر کلی تنها ۴.۷ مگابایت٬ اسکویزنت سطح دقتی مشابه الکس نت (AlexNet) دارد با این تفاوت که ۵۰ پارامتر از آم کمتر دارد.

Places205-GoogLeNet

محل وقوع یک تصویر را از ۲۰۵ دسته مانند ترمینال فرودگاه٬ اتاق خواب٬ جنگل٬ ساحل و غیره تشخیص می دهد.

رسنت۵۰ (ResNet50)

اشیای غالب حاضر در یک تصویر را از مجموعه ای از ۱۰۰۰ دسته مانند درخت ها٬ جانوران٬ غذا٬ ابومبیل ها٬ مردم و غیره را تشخیص می دهد.

اینسپشن (Inception v3)

اشیای غالب حاضر در یک تصویر را از مجموعه ای از ۱۰۰۰ دسته مانند درخت ها٬ جانوران٬ غذا٬ ابومبیل ها٬ مردم و غیره را تشخیص می دهد.

وی جی جی ۱۶ (VGG16)

اشیای غالب حاضر در یک تصویر را از مجموعه ای از ۱۰۰۰ دسته مانند درخت ها٬ جانوران٬ غذا٬ ابومبیل ها٬ مردم و غیره را تشخیص می دهد.

روباتی که به کمک یادگیری ژرف موسیقی می سازد

روبات چهار بازوی ماریمبا (Marimba) از یادگیری ژرف (Deep Learning) برای ساختن موسیقی خود استفاده می کند
مرکز تکنولوژی موسیقی جورجیا که آن را جیل وینبرگ هدایت می کند٬ با ترکیب خلاقیت و مهارت های فنی در روباتیک و هوش مصنوعی به اجرای موسیقی های خارق العاده با روبات ها شهرت دارد. آنها در  پروژه هایی مانند بازوی دوم سایبرنتیک برای درامر (Cybernetic second arm for a drummer)٬ بازوی سوم سایبرنتیک برای درامر (a cybernetic third arm for a drummer)٬ و پروژه های جذاب دیگری که در آنها روبات ها با انسان ها برای ساخت موسیقی بداهه به طرز چشم گیری همکاری می کنند. آخرین چیز معمولا شیمون (Shimon) یک روبات چهار بازو را شامل می شود که می تواند موسیقی را به صورت همزمان تحلیل کند و به طور بداهه با ساززن انسان همکاری کند.

تماشای چنین چیزی بسیار چشم گیر است. اما توانایی نواختن شیمون محدود به آنچه بقیه نوازندگان می نواختند بود. در حال حاضر شیمون با استفاده از یادگیری ژرف به تنهایی به نواختن نوت های یکتا و قابل تحسین می پردازد.

استاد شیمون دانشجوی دکترای جورجیا تک (Georgia Tech) میسون برتن (Mason Bretan) است. ملودی و ساختار  هارمونیک که به آن گوش می دهید خروجی یک ملودی پایه است از یک شبکه ی عصبی آموزش دیده توسط ۵۰۰۰ ترانه ی کامل به همراه ۲ میلیون عنصر موسیقی دیگر عبور کرده است.

 

در قطعه ی دومی که شیمون آن را نواخت٬ برتن از یک ملودی پایه سریع تر استفاده کرد و شیمون به قطعه ای کاملا متفاوت ولی با آهنگ تند تری دست یافت.

دقت به این نکته مهم است که شیمون تنها المان های مختلف موسیقی را که با آن برنامه ریزی شده به هم نمی چسباند٬ یه اینکه به طور تصادفی موسیقی ایجاد کند. نکته ی خارق العاده درباره ی شیمون این است که شبکه ی عصبی ژرف آن به در عمل به هزاران قطعه ی موسیقی گوش فرا داده و نوازندگی های آن نتیجه ی آموخته های آن از این قطعات است.

آموزش یادگیری ژرف | شبکه های عصبی

آموزش یادگیری ژرف Deep Learning  |  آشنایی با شبکه های عصبی

برای شروع یادگیری ژرف (Deep Learning) ما نیاز به دانستن و یادگیری یک سری پیشنیاز داریم که به مرور در مورد هرکدام صحبت خواهیم کرد. امروز در مورد شبکه های عصبی صحبت خواهیم که مقدمه ای پایه ای و اساسی برای ورود به یادگیری عمیق ( ژرف )‌ هست.
شبکه های عصبی مصنوعی (Artificial Neural Network – ANN) در واقع یک مدل بسیار ساده شده از شبکه های عصبی درون مغز ما الهام گرفته شده. این شبکه با الهام از شبکه های عصبی بدن ما به صورت ریاضی پیاده سازی شدند. در شکل زیر یک تصویر از یک شبکه عصبی مغز ما قرار گرفته است.

همونطور که شکل پیداست این شبکه عصبی از چند بخش اصلی تشکیل شدند شامل :نورون، دندریت ها، و اکسون ها و…می باشد. سه قسمت اصلی این شبکه عصبی یعنی همان نورون ها، دندریت ها و اکسون ها به طور مشابه در شبکه عصبی مصنوعی پیاده سازی شده اند به این صورت که در شبکه عصبی واقعی دندریت ها اطلاعات مختلف را دریافت می کنند، در درون این اطلاعات پردازش شده و به کمک آکسون ها به بیرون منتقل می شود. این فرآین به طور مشابه در شبکه های عصبی مصنوعی نیز پیاده سازی شده است.طبق شکل زیر :

ساختار ریاضی شبکه های عصبی

 

در شکل بالا ما با ساختار ریاضی الهام گرفته شده از شبکه عصبی واقعی مواجه هستیم، در این ساختار ورودی های مختلف ( ماننده x1 وx2 و x3) که از طریق ورودی به داخل شبکه عصبی مصنوعی وارد می شوند.سپس این ورودی ها در وزن هایی ضرب شده به داخل هسته اصلی رفته روی آن یک فعالیت انجام گرفته و در نهایت از خروجی ( y) مقدار نهایی خارج می شود.این ساده ترین حالت ممکن برای یک شبکه عصبی می باشد.
شبکه های عصبی می توانند بسیار پیچیده تر و متفاوت تر باشند به طور مثال تصویر نمایانگر یک شبکه عصبی کمی متفاوت تر است.

شبکه عصبی می توانند بسیار عمیق و یا خیلی ساده باشند. در مطالب بعدی بیشتر در این مورد صحبت خواهیم کرد.