اکسترممها
فهرست مطالب
19.1 مقدمه
19.1.1 بررسی یادگیری به عنوان یک فرآیند بهینهسازی
یادگیری یک فرآیند بهینهسازی با هدف افزایش دانش، مهارتها و قدرت خلاقیت است. این امر هم برای آموزش و هم برای یادگیری ماشین صدق میکند. برای ردیابی فرآیند یادگیری، به تابعی نیاز داریم که پیشرفت را اندازهگیری کند. یک معیار قدیمی، معدل (GPA) است که میانگین برخی نمرات در یک سیستم آموزشی را محاسبه میکند، و معیار دیگر نمرات IQ است که با انجام آزمونها اندازهگیری میشود. یک مثال دیگر از معیار در یک محیط تحقیقاتی، امتیاز شبکه اجتماعی مانند تعداد استنادها یا شاخص h است. برای خودرویی که به طور خودران رانندگی میکند، میتواند تابع باشد که در آن تعداد تصادفات ایجاد شده با استفاده از پیکربندی پارامتر در یک دوره زمانی ثابت است.

19.1.2 آیا هوش مصنوعی بر همه حوزهها غلبه خواهد کرد؟
هنگامی که چارچوب و تابع ثابت شد، سوال این است که چگونه را به طور مؤثرتری افزایش دهیم. این تصویر سادهانگارانه هم برای هوش انسانی و هم برای هوش مصنوعی کاملاً مؤثر است. برای بسیاری از توابعی که در نظر گرفته شدهاند (برنده شدن در بازیهای شطرنج، قدرت محاسباتی، نگهداری دادهها، تشخیص ویژگی، رانندگی با خودرو یا پرواز با هواپیما)، ماشینها به سرعت پیشرفت کردند. به ندرت کسی وجود دارد که به طور جدی شک کند که انسانها در نهایت برای هر تابع که قابل تصور است، نبرد را خواهند باخت. هنوز حوزههایی وجود دارند که ماشینها در آنها تسلط پیدا نکردهاند. نمونههایی از آن هنر یا نوشتن مقالات علمی هستند.1
19.1.3 مزیت یادگیری ماشین در بهینهسازی مبتنی بر گرادیان
هنگامی که یک ماشین تابع را میشناسد، میتواند به راحتی از یک موقعیت تعیین کند که برای افزایش در کدام جهت تغییر کند. جهت سریعترین افزایش جهت گرادیان تابع است. در حساب دیفرانسیل و انتگرال، به موقعیتهایی نگاه میکنیم که موقعیت فقط از چند متغیر تشکیل شده است. حساب دیفرانسیل و انتگرال تک متغیره با وضعیت یک متغیر سروکار دارد. ما در اینجا به وضعیت با متغیر نگاه میکنیم اما بیشتر با متغیر کار خواهیم کرد زیرا این کار ایده اصلی را ارائه میدهد. اصل این است که به یک بهینه رسیدهایم که در آن هیچ تغییری دیگر نمیتواند تابع را افزایش دهد. این از نظر ریاضی به این معنی است که مشتق تابع صفر است. ما چنین نقاطی را "نقاط بحرانی" مینامیم.
19.1.4 استفاده از گرادیانها برای یافتن جهت بهبود
اجازه دهید ابتدا به نرخ تغییر یک تابع در امتداد یک جهت نگاه کنیم. یک منحنی را در نظر بگیرید که در آن یک بردار واحد است. با قاعده زنجیرهای، نرخ تغییر در به صورت زیر داده میشود:
19.2 سخنرانی
19.2.1 یافتن بهینهها با گرادیانها
همه توابع در اینجا فرض میشوند که در باشند، به این معنی که دو بار پیوسته مشتقپذیر هستند. همه چیز با یک مشاهده شروع میشود که به پیر دو فرما برمیگردد:
قضیه 1. اگر یک بیشینه از باشد، آنگاه .
اثبات. ما این را با برهان خلف اثبات میکنیم. فرض کنید ، بردار را تعریف کنید و به نگاه کنید، که تابعی از یک متغیر است. با قاعده زنجیرهای، این تابع
19.2.2 آشکارسازی نقاط بحرانی
نقطه با یک نقطه بحرانی از نامیده میشود. با فرمول تیلور، در یک نقطه بحرانی تقریب درجه دوم را داریم، که در آن ماتریس هسین است.
19.2.3 آزمون مشتق دوم وارد عمل میشود
همانند یک بعد، داشتن یک نقطه بحرانی تضمین نمیکند که یک نقطه یک بیشینه یا کمینه محلی باشد. آزمون مشتق دوم در حساب دیفرانسیل و انتگرال تک متغیره تضمین میکند که اگر
19.2.4 ماتریسهای معین مثبت و معین منفی
یک ماتریس معین مثبت نامیده میشود اگر برای همه بردارهای باشد. معین منفی نامیده میشود اگر برای همه بردارهای باشد. یک ماتریس قطری با درایههای قطری مثبت معین مثبت است. در عبارات زیر، فرض میکنیم یک نقطه بحرانی است.
19.2.5 آشکارسازی نقش هسینهای معین مثبت
میگوییم یک بیشینه محلی از است اگر وجود داشته باشد به طوری که برای همه . میگوییم، یک کمینه محلی از است اگر برای همه . چگونه میتوانیم بررسی کنیم که یک نقطه بیشینه یا کمینه محلی است؟
قضیه 2. فرض کنید . اگر معین مثبت باشد، آنگاه یک کمینه محلی است. اگر معین منفی باشد، آنگاه یک بیشینه محلی است.
اثبات. از آنجایی که ، تقریب درجه دوم در به صورت برای غیرصفر کوچک و هسین است. عبارت مشابه برای کمینه را میتوان با جایگزینی با استنتاج کرد. ◻
19.2.6 طبقهبندی نقاط اکسترمم در دو بعد
اجازه دهید به حالتی نگاه کنیم که تابعی از دو متغیر است به طوری که و . ماتریس هسین به صورت است.
در این حالت دو بعدی، میتوانیم نقاط بحرانی را اگر دترمینان از غیرصفر باشد، طبقهبندی کنیم. عدد همچنین ممیز در یک نقطه بحرانی نامیده میشود.




19.2.7 توابع مورس و آزمون مشتق دوم
میگوییم یک نقطه مورس است، اگر یک نقطه بحرانی باشد و دترمینان غیرصفر باشد. یک تابع یک تابع مورس است اگر هر نقطه بحرانی مورس باشد. نمونههایی از توابع مورس عبارتند از ، و . حالت آخر یک زین اسبی هذلولوی نامیده میشود. به طور کلی، یک نقطه بحرانی یک زین اسبی هذلولوی است اگر باشد و اگر نه بیشینه باشد و نه کمینه. در اینجا آزمون مشتق دوم در بعد آمده است:
قضیه 3. فرض کنید یک نقطه بحرانی با داشته باشد.
- اگر و آنگاه یک کمینه محلی است.
- اگر و آنگاه یک بیشینه محلی است.
- اگر آنگاه یک زین اسبی هذلولوی است.
اثبات. پس از انتقال و جایگزینی با ، داریم و . در نقطه بحرانی، تقریب درجه دوم اکنون است. این را میتوان به صورت با و ممیز بازنویسی کرد. اگر و آنگاه و تابع برای همه مقادیر مثبت دارد. نقطه آنگاه یک کمینه است. اگر و ، آنگاه و تابع برای همه مقادیر منفی دارد و نقطه یک بیشینه محلی است. اگر ، آنگاه در نزدیکی مقادیر منفی و مثبت میگیرد. ◻
19.2.8 از هسین تا انحنای گاوس
میتوان پرسید، چرا انتخاب شده است و نه . مهم نیست، زیرا اگر ، آنگاه هر دو و باید غیرصفر باشند و علامت یکسانی داشته باشند. به جای ، میتوانستیم اثر طبیعیتر را نیز انتخاب کنیم. این تحت تغییرات مختصات مشابه دترمینان ناوردا است. ممیز همچنین انحنای گاوس سطح در آن نقطه است.
19.2.9 لم مورس
در ابعاد بالاتر، وضعیت توسط لم مورس توصیف میشود. این لم میگوید که در نزدیکی یک نقطه بحرانی، یک تغییر مختصات وجود دارد به طوری که یک تابع درجه دوم است که در آن قطری با درایههای یا است. سپس میتوان به نقطه بحرانی یک شاخص مورس نسبت داد که تعداد درایههای در است. لم مورس در واقع یک قضیه است (قضایا از لمها=قضایای کمکی مهمتر هستند).
قضیه ۴. در نزدیکی یک نقطه بحرانی مورس از یک تابع به نام ، یک تغییر مختصات وجود دارد به طوری که برابر است با
اثبات. از استقرا نسبت به استفاده میکنیم.
- پایه استقرا: برای ، نتیجه میگوید که برای یک نقطه بحرانی مورس، تابع به صورت یا است. ابتدا نشان میدهیم که اگر
، ، آنگاه یا برای یک تابع مثبت است. اثبات. با یک تغییر مختصات خطی فرض میکنیم و . آنگاه وجود دارد به طوری که : این برای است و در حد مقدار است. با قاعده ضرب، با . چون میتوان را برای تعریف کرد و حد را گرفت، زیرا با اعمال دو بار هوپیتال، حد برابراست. تغییر مختصات اکنون توسط تابعی داده میشود که در صدق میکند. مشتقگیری ضمنی را میدهد، بنابراین با قضیه تابع ضمنی وجود دارد. - گام استقرا : ابتدا توجه میکنیم که تیلور برای با جمله باقیمانده دلالت بر این دارد که با برخی توابع پیوسته . علاوه بر این، مقدار تابع مختصات هسین هستند. ابتدا یک چرخش اعمال کنید تا . حال به نگاه کنید و سایر مختصات را ثابت نگه دارید. مانند (i)، یک تغییر مختصات پیدا کنید به طوری که ، که در آن ویژگیهای را به ارث میبرد اما یک بعد کمتر دارد. با فرض استقرا، یک تغییر مختصات دوم وجود دارد به طوری که ترکیب و فرم نرمال مورس را تولید میکند.
◻
۱۹.۳ مثالها
مثال ۱. سوال: نقاط بحرانی را طبقهبندی کنید.
پاسخ: از آنجایی که است، نقاط بحرانی عبارتند از ، ، و . ما محاسبه میکنیم برای و داریم و بنابراین نقاط زینی هستند. برای ، داریم ، ، یک بیشینه محلی. برای که در آن ، داریم یک کمینه محلی.
تمرینها
تمرین ۱.
- نقاط بحرانی تابع را طبقهبندی کنید. (بیشینه، کمینه یا نقاط زینی).
- حال همین کار را برای انجام دهید و شاخص مورس را در هر نقطه بحرانی پیدا کنید.
تمرین ۲. تمام نقاط بحرانی تابع بعدی منطقه را پیدا کنید. هسین را در هر نقطه بحرانی محاسبه کنید و بیشینهها (همه مقادیر ویژه منفی) و کمینهها (همه مقادیر ویژه مثبت) را تعیین کنید.
پ.ن. منطقه یک موضوع قدیمی است. اما منطقه بعدی هنوز بسیار طبقهبندی شده است و شایعه شده است که در نزدیکی سمت تاریک ماه قرار دارد.
تمرین ۳. روی سطح پارامتری دما در کجا کمینه است. تمام نقاط بحرانی تابع را طبقهبندی کنید. [اگر تابع را پیدا کردهاید، میتوانید دوباره و را با و جایگزین کنید اگر ترجیح میدهید با یک تابع کار کنید.]
تمرین ۴. تمام نقاط بحرانی تابع را پیدا کنید. در هر یک از موارد، ماتریس هسین را پیدا کنید. همچنین در اینجا مقادیر ویژه را محاسبه کنید. اینها اعداد هستند به طوری که برای یک بردار غیرصفر. میتوان آنها را با جستجوی ریشههای چندجملهای مشخصه پیدا کرد. میتوانید آنها را روی کامپیوتر محاسبه کنید. در هر مورد مقادیر ویژه را پیدا کنید.
تمرین ۵.
- یک تابع با بیشینه و نقطه زینی و یک کمینه پیدا کنید.
- در زیر یک نقشه کانتور از یک تابع دو متغیره میبینید. چند نقطه بحرانی وجود دارد؟ آیا تابع یک تابع مورس است؟

- ممکن است مقاومت وجود داشته باشد: انسانها ممکن است تصمیم بگیرند که به پیشرفتهای علمی توسط ماشینها استناد نکنند. از سوی دیگر، چه کسی نمیخواهد یک "نظریه همه چیز" را یاد بگیرد حتی اگر توسط یک ماشین کشف شده باشد؟↩︎