در رگرسیون، پژوهشگر به دنبال آن است که بتواند کمیت متغیر مجهول را با استفاده از متغیرهای معلوم، تعیین و پیش بینی کند، در حالی که در همبستگی فقط به دنبال روابط بین دو متغیر است.
در رگرسیون، از وجود رابطه بین دو متغیر برای پیش بینی کردن مقدار یک متغیر (وابسته) از روی متغیر دیگر (مستقل) استفاده می شود که جنبه پیش بینی کننده دارد.
در همبستگی درجه رابطه دو متغیر با یک عدد بیان می شود که به عنوان ضریب همبستگی شناخته می شود ولی در رگرسیون، هدف آن است که بعضی از مشخصات از روی آگاهی در مورد سایر مشخصات، برآورد یا پیش بینی شود که این کار از طریق معادله رگرسیون انجام می گیرد که در این معادله، هریک از ضرایب رگرسیون به عنوان وزن بتا شناخته می شود و بعلاوه باقیمانده ها از اهمیت زیادی برخوردار است.
در پژوهش هایی که از روش های آماری رگرسیون استفاده می شود می تواند از نوع ساده و یک متغیره (مانند رابطه بین اعتبار مصرف شده و توسعه سازمان، یا رابطه بین میزان تبلیغات و فروش و یا پیش بینی عملکرد تحصیلی دانشجویان در دانشگاه با توجه به نمرات آزمون ورودی آنان) یا از نوع رگرسیون چند گانه (مانند بررسی تعداد فروش با توجه به میزان تبلیغات و نیز تعداد فروشندگان یا در بررسی میزان پس انداز خانواده ها با توجه به میزان درآمد خانواده ها و تعداد فرزندان و یا بررسی نوع شغل، حقوق و سابقه خدمت کارمندان با متغیر ملاک یعنی رضایت شغلی) و رگرسیون لوجستیک باشد.
توضیح اینکه، رگرسیون چندگانه نوعا به مدل های رگرسیون با یک متغیر وابسته و دو متغیر پیش بین یا بیشتر اطلاق می شود.
در مقابل، در رگرسیون چند متغیره، متغیرهای وابسته چندگانه و هر تعداد متغیر مستقل وجود دارد.
لازم به ذکر چنانچه بیش از یک متغیر مستقل در رگرسیون چند متغیره و بیش از یک متغیر پیش بین وجود داشته باشد، گاه این مدل رگرسیونی، رگرسیون چندگانه چند متغیره نامیده می شود.
مثال از رگرسیون چند متغیره ارائه می گردد.
پزشکی محصولات لبنی و شیرینی را که در هفته مصرف می شود مورد توجه قرار داده است.
در این موضوع وی قصد دارد رابطه عادات غذایی و سلامتی را بررسی نماید.
برای بررسی اینکه افراد چقدر از شغل خود لذت می برند؟ متغیرهایی چون درآمد، میزان تحصیلات، سن، جنسیت، سابقه خدمت و وضعیت اجتماعی و اقتصادی بررسی می شود.
در این مثالها سلامتی و رضایت، متغیر ملاک و عوامل یاد شده، متغیر پیش بین است.
رگرسیون و همبستگی بسیار به هم وابسته هستند.
هر دو روش آماری شامل رابطه میان دو متغیر است و هر دو از سری نمره، از یک آزمودنی استفاده می کنند.
اما در بیان تمایز آن، همبستگی به دنبال یافتن مقدار و جهت رابطه می باشد؛ تمرکز رگرسیون بر استفاده از روابط برای پیش بینی است.
اصطلاح پیش بینی به معنای آن است که اگر دو متغیر بطور کامل با یکدیگر همبستگی داشته باشند؛ پس می توان از مقدار یک متغیر، برای پیش بینی همبستگی کامل مقدار متغیر دوم استفاده نمود.
به عبارتی، اگر دو متغیر بطور معنادار با یکدیگر همبستگی داشته باشند، پژوهشگر می تواند از یک متغیر برای پیش بینی متغیر دوم استفاده کند.
در نتیجه، رگرسیون، روشی بر پیش بینی متغیرها است.
در رگرسیون، متغیرهای پیش بین و متغیر ملاک مطرح می شود و به تحلیل گر کمک می کند که توان متغیرهای پیش بین را در تبیین متغیر ملاک (وابسته) ارزیابی شود.
در این روش، مقدار بتا یا همان ضریب استاندارد شده رگرسیون، برای تعیین توان پیش بینی متغیر پیش بین با متغیر ملاک، مهم است.
در رگرسیون از چند روش استفاده می شود.
به عبارتی، در این روش، ترتیب وارد شدن متغیرهای پیش بین به درون مدل یا خارج شدن از آن بر اساس قدرت همبستگی آن ها با متغیر ملاک تعیین می شود که به چند دسته تقسیم می شود:
الف) روش هم زمان
در روش چند گانه هم زمان، تمام متغیرهای پیش بین باهم وارد تحلیل می شوند. اگر پژوهشگر مدل نظری یا تئوری ندارد یا تعداد موارد محدود است، مناسبترین روش، روش هم زمان است. اگر هیج مدل نظری مورد نظر محقق نباشد یا تعداد موارد کم است، مناسبترین روش استفاده از روش هم زمان است.
ب) رو به جلو
یا پیش رو در این روشی، تک تک متغیرهای مستقل وارد معادله می شود و بر اساس قدرت پیش بینی کننده برای همبستگی آن ها با متغیر ملاک، وارد مدل می شود. در نتیجه متغیرهایی که به صورت معنا داری توان موفقیت مدل را افزایش نمی دهند، حذف نمی شوند.
ج) رو به عقب
یا پس رو تمام متغیرهای مستقل یا پیش بین، ابتدا وارد معادله وسپس در صورت نداشتن معیار لازم، ضعیف ترین متغیر پیش بین تک به تک حذف و رگرسیون مجددا محاسبه می شود.
به عبارتی، اگر این عمل باعث ضعیف شدن معنا دار مدل شود آن، متغیر مجدداً وارد می شود در غیر این صورت، از متغیرها، تک به تک حذف می شوند.
این شیوه تا هنگامی که فقط متغیرهای پیش بین سودمند در مدل باقی بمانند، ادامه می یابد.
د) روش گام به گام
این روش پیچیده ترین است. زمانی از رگرسیون گام به گام استفاده می شود که پژوهش گر چند متغیر مستقل دارد و می خواهد ارتباط آن را با متغیر وابسته نشان دهد به عبارتی از متغیرهای مستقل موجود، کدام متغیر به بهترین وجه میتواند متغیر وابسته را پیش بینی کند و سهم هر متغیر چقدر است؟ و در مجموع، با همدیگر چقدر قادر به پیش بینی هستند.
این روش، ترکیبی از دو روش روبه جلو و رو به عقب است است که دران اولین متغیرهای مستقل یا پیش گویی کننده (بر اساس ملاحظات آماری یعنی بالاترین ضریب همبستگی و با توالی معین) وارد تحلیل می شود و چنانچه با ورود متغیر جدید، معنا داری خود را از دست داده باشد، از معادله خارج می شود.
در این روش، ترتیب ورود متغیرها، در اختیار پژوهشگر نیست.
به عبارتی، در این روش، هر متغیرها براساس توالی وارد شده و سپس مقدار ان تعیین می شود.
اگر اضافه شدن متغیری به مدل کمک کند، در مدل باقی مانده اما دراین حالت، کلیه متغیرهای باقی مانده در مدل، مورد آزمون مجدد قرار می گیرند تا مشخص شود که هنوز در موفقیت مدل سهیم هستند، در غیر این صورت حذف می شوند.
بنابراین در استفاده از این مدل باید اطمینان حاصل کرد که کمترین تعداد از متغیرهای پیش بین در مدل باقی بماند.
در رگرسیون قدم به قدم نسبت به روش همزمان، یک واقعیت، تردید کننده وجود دارد، بدین معنا که اضافه شدن یک متغیر مستقل دیگر می تواند نقش سایر عوامل پیش بینی کننده را بر روی واریانس متغیر وابسته کاملا تغییر دهد.
ه) روش سلسله مراتبی
در این روش ترتیب ورود متغیرها به تحلیلی، براساس یک چارچوب نظری یا تجربی مورد نظر پژوهشگر صورت می گیرد .
در این روش، ترتیب ورود متغیرها به تحلیل بر اساس یک چارچوب نظری یا تجربی صورت می گیرد. به عبارت دیگر پژوهشگر، درباره ترتیب ورود متغیرها به تحلیل تصمیم گیری می کند. در نتیجه اگر دلایل متقن نظری وجود نداشته باشد، استفاده از این روش توصیه نمی شود. این تصمیم گیری که قبل و شروع تحلیل اتخاذ می شود می تواند اساس سه اصل عمدہ مبتنی باشد:
- رابطه علت و معلولی:
- رابطه متغیرها در پژوهش های قبلی:
- ساختار طرح پژوهشی (برای مثال در طرح های عاملی ابتدا اثرهای اصلی و سپس اثرهای متقابل آن ها وارد تحلیل می شود).
به طور کلی، از آن جا که روش تحلیل رگرسیون سلسله مراتبی با توجه به چارچوب نظری یا تجربی ویژه ای صورت می گیرد، در پژوهش های علوم رفتاری از اهمیت خاصی برخوردار است .
در تحلیل نتایج از جداول رگرسیون، علاوه بر توجه به مقدار ویژه (به منظور رد یا قبول فرضیه صفر) به چند نتیجه دیگر دقت شود:
۱. مقدار بتا
در نتیجه گیری از مدل رگرسیون، مقدار بتا یا همان ضرایب استاندارد بتا، مهم است.
وزن های بتا مشخص می کند که با تغییر یک انحراف معیار در متغیر مستقل مورد نظر، چند انحراف معیار تغییر در متغیر وابسته رخ خواهد داد.
مقدار بتا، مقیاسی برای تعیین میزان ارتباط متغیرهای پیش بین با متغیر ملاک است.
بتا، بر اساس واحد انحراف استاندارد، اندازه گیری می شود.
برای مثال اگر مقدر بتای ۵/۲ باشد، این مقدار مشخص می کند که میزان تغییر یک انحراف استاندارد در متغیر پیش بین، منجر به تغییر ۵/۲ انحراف معیار در متغیر ملاک میشود.
توجه شود که متغیر با بیشترین وزن بتا، بیشترین همبستگی را نیز با متغیر وابسته دارد.
لذا، به هر میزان که مقدار بتا بزرگتر باشد، اثر و به عبارتی رابطه متغیر پیش بین با ملاک بیشتر خواهد بود.
اگر در پژوهشی فقط یک متغیر پیش بین وجود داشته باشد، بتا برابر با ضریب همبستگی بین متغیر پیش بین وملاک خواهد بود.
اما با حضور چند متغیر پیش بین می توان سهم هریک از متغیرهای پیش بین را با متغیر ملاک محاسبه نمود و قدرت رابطه هریک از متغیرهای پیش بین را با متغیر ملاک سنجید.
۲. ضریب تعیین
علاوه بر آن مقدار ضریب تعیین نیز مهم است. ضریب تعیین، معیاری است که می توان با آن رابط دو متغیر X و y را توضیح داد.
ضریب تعیین، نشان می دهد که چند درصد تغییرات متغیر وابسته، قابل استناد به متغیر مستقل است و بقیه تغییرات ناشی از شانس (عوامل غیر متغیر مستقل یا X) است.
ضریب تعیین نسبن به ضریب همبستگی، معیار گویاتری است.
به عنوان مثال اگر مقدار ۸۰/۰=T باشد، ضریب تعیین ۶۴/۰ است (ضریب همبستگی به توان ۲ = ضریب تعیین). یعنی ٪۶۴ از تغییرات لا ناشی از تغییرات X است.
به طور خلاصه، ضریب تعیین، نشانگر مجذور همبستگی چند گانه در پیش بینی متغیر ملاک از روی متغیرهای پیش بین است.
یا اگر مقدار مجذور تنظیم شده ۷۵/۰ باشد، میتواند نتیجه گرفت که متغیر انتخاب شده، می تواند ۷۵٪ واریانس در متغیر ملاک را پیش بینی کند.
هم چنین میتوان از ضریب تعیین تصحیح شده که درجه آزدی را نیز محاسبه نموده است و نیز دقیق تر از ضریب تعیین می باشد، استفاده نمود.
۳. دقت شود از نتایج همبستگی و نیز رگرسیون، نمی توان روابط علی بین متغیرها را نتیجه گرفت.