رگرسیون لجستیک

رگرسیون لوژستیک

تحلیل رگرسیون لوژستیک در Spss

آشنایی با رگرسیون لوژستیک – کاربردی

تابع لوجیت

مقایسه ی بین رگرسیون خطی و لوژستیک

برآورد ماکزیمم درست نمایی

مقدمات رگرسیون ناپارامتری

معرفی رگرسیون ناپارامتری

تحلیل رگرسیون ناپارامتری

یک نمونه ی کاربردی برای رگرسیون دوجمله ای منفی

1-مواردناهمساز: (outlier cases)

2-چند هم خطی بودن(Multicollinarity)

کدگذاری تصنعی(Dummy Codding)

رگرسيون لوژستيك (لوجستيك)

رگرسيون چند متغييري

لوجیت

تحلیل تشخیص خطی

نتیجه

منابع

مقدمه

رگرسیون کاذب (به انگلیسی: regression ) با فرض اینکه متغیرهای و مانا می‌باشد تخمین‌های ما از پارامترها و تستهای و درست می‌باشد. برای نشان دادن سازگاری تخمین‌های حداقل مربعات معمولی؛ ما از این نتایج زمانیکه اندازه نمونه افزایش می‌یابد و واریانس نمونه به واریانس جامعه همگرا می‌شود، استفاده می‌کنیم. متاسفانه وقتی سری نامانا باشد واریانس خوش تعریف نیست زیرا حول یک میانگین ثابت نوسان نمی‌کند. برای توضیح بیشتر دو متغیر و را در نظر بگیرید که بوسیله یک فرآیند گام تصادفی تعریف می‌شود.

که و دارای توزیع مستقل می‌باشد.هیچ دلیلی برای ارتباط بین و وجود ندارد یک محقق اگراثر راروی و یک جز ثابت رگرس کندو رگرسیون زیر را انجام دهد :

خط راست

نتایج این رگرسیون ممکن است بوسیله r^۲ بالاوخود همبستگی بالا بین باقیمانده هاو همجنین دارای ارزش معنی داری برای پارامتر باشد. این پدیده به رگرسیون کاذب معروف است. در این گونه از موارد دو سری نامانا ارتباط کاذبی دارند به این علت که که هر دوی آنها در طول زمان تغییر می‌کنند و تابعی از زمانند. هماطور که گراجر و نی یو بلد بیان کردند در این حالت رگرسیون دارای r^۲ بالا؛ و آماره دوربین واتسون پایین خواهد بود و تستهای و ممکن است خیلی گمراه کننده باشند. دلیل آن نیز این است که توزیع‌های آماره‌های تست‌های سنتی خیلی متفاوت از نتایجی که تحت فرض مانایی گرفته می‌شود، می‌باشد. بخصوص همانطور که فلیپس (۱۹۸۷)نشان داد؛ همانطور که اندازه نمونه افزایش می‌یابد نمی‌توان به معنی داری تخمین زن حداقل مربعات معمولی وآماره‌های تست‌های و و آماره دوربین واتسون اعتماد کرد. دلیل آن این است که و متغیر‌های می‌باشد و جر خطا نیزیک متغیرنامانا می‌باشد.

اگر ارزش‌های گذشته هر دو متغیر وابسته و مستقل را در رگرسیون وارد کنیم مشکل رگرسیون کاذب حل می‌شود. در این حالت تخمین‌های حداقل مربعات معمولی برای همه پارامتر‌ها سازگار می‌باشد.

شیوه‌های مهم تحلیل‌های رگرسیونی به شرح زیر هستند.

•رگرسیون خطی ساده

•رگرسیون خطی چندگانه

•رگرسیون فازی

•رگرسیون لجستیک

این تنوع باعث شده که بتوان به راحتی هر نوع داده‌ای (اغلب از نوع داده‌های پیوسته) را تحلیل کرد و به راحتی نتیجه گیری نمود.

محاسبه

برای انجام یک تحلیل رگرسیونی ابتدا تحلیل‌گر حدس می‌زند که بین دو متغیر، نوعی ارتباط وجود دارد، در حقیقت حدس می‌زند که یک رابطه به شکل یک خط بین دو متغیر وجود دارد و سپس به جمع‌آوری اطلاعات کمی از دو متغیر می‌پردازد و این داده‌ها را به صورت نقاطی در یک نمودار دو بعدی رسم می‌کند.

نرم افزارها

نرم افزارهای بسیاری هستند که قابلیت محاسبه رگرسیون را دارند و مشهورترین آنها عبارتند از

•نرم افزار اکسل (که ساده ترین نرم افزار است)

•اس‌پی‌اس‌اس SPSS

•اس‌پلاس +S یا Plus-S

•وایازش لجستیک یک مدل آماری رگرسیون برای متغیرهای وابسته دودویی است. این مدل را می‌توان به عنوان مدل خطی تعمیم یافته‌ای که از تابع لوجیت به عنوان تابع پیوند استفاده می‌کند و خطایش از توزیع چند جمله‌ای پیروی می‌کند، به حساب آورد.