پایان نامه با کلمات کلیدی اثرات ثابت، رگرسیون، انحراف معیار، آزمون فرضیه

که تمامی آزمونهای آماری در سطح معناداری 95% انجام گرفته است.

3-7 روشهای آماری آزمون فرضیهها
3-7-1 آمار توصیفی
شاخص های مرکزی و پراکندگی برای متغیرهای تحقیق بمنظور تحلیل توصیفی متغیرها قبل از آزمون فرضیهها تعیین میشوند. میانگین به عنوان مهمترین شاخص مرکزی به همراه انحراف معیار به عنوان مهمترین شاخصهای پراکندگی محاسبه خواهد شد، انحراف معیار نیز پراکندگی دادهها را نشان میدهد. این اقدام به منظور ارائه دیدگاهی کلی نسبت به جامعه آماری و شناخت بیشتر آن صورت میگیرد.

3-7-2 بررسی نرمال یا غیر نرمال بودن دادههای پژوهش
برای اجرای روش های آماری و محاسبه آماره آزمون مناسبت و استنتاج منطقی درباره فرضیههای پژوهش مهمترین عمل قبل از هر اقدامی، انتخاب روش آماری مناسب برای پژوهش است برای این منظور آگاهی از توزیع دادهها از اولویت اساسی برخوردار است.
برای همین منظور در این پژوهش از آزمون معتبر جارکو- براو برای بررسی فرض نرمال بودن دادههای پژوهش استفاده شده است.
آزمون جارکو-برا روش ناپارامتری سادهای برای تعیین همگونی اطلاعاتی تجربی با توزیع فراوانی مشاهدهها جمعآوری شده است. این آزمون برای گرفتن مجوز لازم جهت استفاده از رگرسیون و ضریب همبستگی پیرسون بر متغیرهای مستقل و وابسته اعمال میگردد تا نرمال بودن اطلاعات اثبات گردد.

3-7-3 دادههای پانل (دادههای تابلویی)
مدلهای اقتصادی از نظر استفاده از دادههای آماری به سه بخش تقسیم میشوند، در برخی از آنها برای برآورد مدل، از اطلاعات سری زمانی استفاده میشود. در مدلهای مبتنی بر سریهای زمانی، مقدار متغیرهای مختلف مدل، تابعی از زمان هستند. بعضی دیگر از مدلها بر اساس دادههای مقطعی برآورد میشوند. در مدلهای مبتنی بر دادههای مقطعی، زمان به هیچ عنوان نقشی نداشته و مقدار متغیرهای مختلف مدل تابعی از مقاطع مختلف است. در برخی از مطالعهها، طراحی مدلهایی که صرفاً مبتنی بر آمارهای سری زمانی و یا مقطعی است، فروض ضمنی محدودکنندهای بر نتایج حاصل، تحمیل میکند و منجر به کاهش اعتبار نتایج به دست آمده از مدل میشود. بنابراین برای افزایش دقت مطالعه، تفکیک این دو مقوله ضروری است. روش سوم برآورد مدل که در سالهای اخیر بیشتر مورد توجه قرار گرفته است، برآورد مدل بر اساس دادههای پانل است. در این روش یک سری واحدهای مقطعی طی چند سال مورد برازش قرار میگیرند. تحلیل با دادههای ادغام شده، محیطی بسیار غنی از اطلاعات را برای گسترش فنون تخمین و نتایج نظری فراهم میآورد.
در بسیاری از موارد محققان از این روش، برای مواردی که نمیتوان مسائل را به صورت سری زمانی یا مقطعی بررسی کرد یا زمانی که تعداد دادهها کم است، استفاده میکنند. از آنجا که لحاظ نکردن برخی از متغیرها در ساختار مدلها موجب ایجاد عدم کارایی در برآوردهای مدلهای اقتصادسنجی میشود، روش دادههای تلفیقی که از ترکیب اطلاعات سریهای زمانی و دادههای مقطعی تشکیل شده است، اثر این نوع متغیرهای لحاظ نشده یا غیر قابل اندازهگیری را بهتر از دادههای مقطعی طی یک سال یا دادههای سری زمانی برای یک مقطع زمانی نشان میدهد. دادههای تلفیقی روند گذشته متغیرها را در بر گرفته و از نظر لحاظ کردن پویایی متغیرها اطمینان ایجاد میکند. یک مدل تجربی بزرگ میتواند به طور کاملتری روابط بین متغیرهای مربوطه، اثرات مثبت و منفی که به لحاظ آماری معنادار هستند، متغیرهای زمان و مکان، اثرات و روابط متقابل بین متغیرها را مشخص کند. ادغام دادههای سری زمانی و مقطعی و ضرورت استفاده از آن بیشتر به علت افزایش تعداد مشاهدهها و بالا بردن درجه آزادی است.

3-7-4 آزمون F لیمر
در خصوص استفاده از پانل، آزمون مربوط به همگنی مقاطع انجام میپذیرد. در صورتی که شرکتها همگن باشند، میتوان به سادگی از روش حداقل مربعات معمولی استفاده نمود، در غیر این صورت، ضرورت استفاده از پانل ایجاب میگردد. در آزمون F فرضیه H_0 یکسان بودن عرض از مبدأها (روش پولینگ یا ترکیبی)، در مقابل فرضیه مخالف H_1، ناهمسانی عرض از مبدأها (روش دادههای تابلویی) قرار میگیرد. بنابراین در صورت رد فرضیه H_0 روش دادههای تابلویی پذیرفته میشود.
فرضیههای این آزمون بر اساس μ_i ها، که بیانکنندهی اثرات فردی و یا ناهمگنیها هستند به صورت زیر است:
H_0=μ_1=μ_2=…=μ_N=0
H_1= ها مخالف صفر استμ_(i ) حداقل یکی از
این آزمون با استفاده از مجموع مربعات باقیمانده مقید (〖RSS〗_R) حاصل از مدل ترکیبی به دست آمده از OLS و مجموع مربعات باقیمانده غیر مقید (〖RSS〗_UR) حاصل از تخمین رگرسیون درون گروهی به صورت زیر است:
i =1,2,…,NY_i=Z_i δ+U_i مدل مقید
i =1,2,…,NY_i=Z_i δ+U_i مدل نامقید
آماره آزمون Fبه شرح زیر است:
(3-1)
که در آن Nتعداد مقاطع، K تعداد متغیرهای توضیحی و T تعداد مشاهدهها در طول زمان است. با مقایسه آماره F محاسباتی با Fجدول، میتوان در صورت بزرگتر بودن آماره F محاسباتی از روش پانل استفاده کرد.

3-7-5 آزمون هاسمن
برای تشخیص اینکه در برآورد مدلهای پانل دیتا، کدام روش (اثرات ثابت و اثرات تصادفی) مناسب میباشد، از آزمون هاسمن (1980) استفاده میشود. در آزمون هاسمن، فرضیه صفر و فرضیه مقابل آن به صورت زیر بیان میگردد:
H_0:E(U_i,X_i )=0
H_1:E(U_i,X_i )≠0
فرضیه صفر به معنای این است که بین جمله خطا (که در بر گیرندهی اثرات فردی است) و متغیرهای توضیحی، هیچ ارتباطی وجود ندارد و در واقع مس
تقل از یکدیگر میباشند. این در حالی است که فرضیه مقابل به این معنی است که بین جزء اخلال و متغیرهای توضیحی، همبستگی وجود دارد(اشرف زاده و مهرگان، 1387).
در صورت رد فرضیه صفر، بهتر است که از روش اثرات ثابت استفاده شود.
اگر b تخمینزننده روش اثرات ثابت، و β ̂ تخمینزن روش تصادفی باشد، آنگاه میتوان نوشت:
(3-2) Var(b-β ̂ )=Var(b)-Var(β ̂ )
هاسمن ثابت نمود که عبارت مذکور دارای توزیع  میباشد.
(3-3)
K: تعداد متغیرهای توضیحی
اگر آماره محاسبه شده از این آزمون از 2K2 بزرگتر باشد، فرضیه صفر مبنی بر اثر تصادفی رد شده و فرض اثر ثابت پذیرفته میشود.

3-7-6 مدل اثرات ثابت
استدلال پایهای مدل اثرات ثابت آن است که در تصریح مدل رگرسیونی نمیتوان متغیرهای توضیحی مناسب را که طی زمان تغییر نمیکنند، وارد مدل کنیم. از این رو، وارد کردن متغیرهای مجازی، پوشش و جبرانی بر این بیتوجهی و ناآگاهی میباشد. استفاده از دادههای تابلویی با اثرات ثابت، یک راه حل مناسب برای عدم تشخیص رگرسیون به خصوص زمانی که اثرات ویژه هر واحد (اثرات فردی) بر اثرات زمانی آن غالب میباشد، خواهد بود. یک روش متداول در فرمولبندی مدل پانل دیتا بر این فرض استوار است که اختلاف بین مقطعها را میتوان به صورت تفاوت در عرض از مبدأ نشان داد. به فرض که Y_i و X_i شامل t مشاهده برای واحد i ام باشد و ε_i بردار جزء اختلال بوده و دارای ابعاد T×1 بوده باشد، در نتیجه داریم:
[█([email protected][email protected]@[email protected]@Y_n )]=[█([email protected]@[email protected]@[email protected])][█([email protected][email protected]@[email protected]@a_n )]+[█([email protected][email protected]@[email protected]@X_n )]β+[█(ε[email protected]ε[email protected]@[email protected]@ε_n )]
که در این فرمولها i بردار یکه با ابعاد T×1میباشد، مدل فوق را میتوان به شکل خلاصه به صورت زیر نوشت.
(3-4) Y=[d_1 d_2…d_n X][aβ]+ε
که d_i متغیر مجازی برای نشان دادن i امین مقطع میباشد. حال اگر ماتریس D را به صورت:
(3-5) D=[d_1 d_2…d_n ]
با ابعاد n و n×T تعریف کنیم، خواهیم داشت:
Y=Dα+Xβ+ε (3-6)
که این رابطه به عنوان مدل حداقل مربعات متغیر مجازی (LSDV)نامیده میشود.
مدل اخیر یک مدل رگرسیونی کلاسیک بوده و هیچ شرط جدیدی برای تجزیه و تحلیل آن لازم نیست. میتوان مدل را با استفاده از روش OLSباK رگرسور در Xو n ستون در D به عنوان یک مدل چند متغیره با n+k پارامتر برآورد کرد. عرض از مبدأ در مدل رگرسیون به این دلیل بین افراد متفاوت است که هر فرد یا واحد مقطعی، ویژگیهای خاص خود را داراست. برای ملاحظه عرض از مبدأهای مختلف میتوان از متغیرهای موهومی استفاده کرد. مدل اثرات ثابت با استفاده از متغیرهای موهومی مدل حداقل مربعات با متغیر موهومی LSDV)) نامیده میشود. مدل اثرات ثابت در شرایطی مناسب است که عرض از مبدأ خاص فرد با یک یا چند متغیر توضیحی همبستگی داشته باشد. یکی از معایب (LSDV) است که وقتی تعداد واحدهای مقطعی (N) خیلی بزرگ باشد، به تعداد زیادی درجه آزادی نیاز داریم. در چنین حالتی ناچاریم N-1متغیر موهومی وارد مدل کنیم و عرض از مبدأ را نیز داشته باشیم که این کار شرایط ایجاد همخطی را فراهم مینماید(ابریشمی، 1383).

3-7-7 مدل اثرات تصادفی
در مدل اثرات تصادفی فرض میشود که عرض از مبدأ یک واحد تکی، انتخابی تصادفی از جامعهای بزرگتر با یک میانگین ثابت است. بدین ترتیب عرض از مبدأ تکی، به صورت انحرافی از این میانگین ثابت بیان میشود. یکی از مزایای مدل اثر تصادفی نسبت به مدل اثرات ثابت این است که به درجههای آزادی کمتری نیاز دارد، چون نباید N عرض از مبدأ مقطعی تخمین زده شود و تنها لازم است، میانگین و واریانس عرض از مبدأ را تخمین بزنیم. مدل اثرات تصادفی در شرایطی مناسب است که عرض از مبدأ (تصادفی) هر واحد مقطعی با متغیرهای توضیحی، همبستگی نداشته باشد(ابریشمی، 1383).
ایده اساسی و اولیه با معادله زیر شروع میشود:
(3-7) Y_(i,t)=β_1i+β_2 X_it+U_it
طرفداران روش اثرات تصادفی معتقدند، به جای اینکه در معادله فوق، β_1i را ثابت فرض کنید، آن را به صورت یک متغیر تصادفی با میانگین β_1 در نظر گرفته و مقدار عرض از مبدأ برای هر مقطع را به صورت زیر بیان نمایید.
(3-8) β_1i=β_1+ε_i
که در آن ε_i جمله خطای تصادفی با میانگین صفر و واریانس σ_ε^2 است.
فرض اساسی در مدل اثرات تصادفی این است، که مقاطع مورد مطالعه متعلق به جامعهای بزرگتر بوده و میانگین مشترکی برای عرض از مبدأ دارند. اختلاف در مقادیر عرض از مبدأ هر مقطع در جمله خطای 〖 ε〗_i منعکس میشود. بر اساس مدل اثرات تصادفی، معادله به صورت زیر خواهد بود:
Y_(i,t)=β_1+β_2 X_it+ε_i+U_it
Y_(i,t)=β_1+w_(i,t)=ε_i+u_(i,t) (3-9)
β_2 X_it+w_(i,t)
جمله خطای ترکیبی 〖 w〗_(i,t) متشکل از دو جزء ε_i (خطای مقطعی) و 〖 u〗_(i,t)(خطای ترکیبی) میباشد. اطلاق مدل اجزاء خطا به این دلیل میباشد که جمله خطای ترکیبی w_(i,t)، از دو یا چند جزء خطا تشکیل شده است. ساختار جمله خطا در روش اثرات تصادفی به گونهای است که باید این روش را با کمک حداقل مربعات تعمیم یافته (GLS) برآورد کرد. خاطر نشان میشود که اگر در الگوی تابلویی مورد نظر فقط اثرات فردی را در
جملات خطا (چه با اثرات ثابت و چه با اثرات تصادفی) لحاظ نمایید، الگوی مورد نظر به صورت الگوی جزء خطای یک جانبه خواهد بود. اما اگر علاوه بر اثرات فردی، اثرات زمانی یا پویاییهای مقطع مربوطه در طی زمان نیز لحاظ شود، الگوی مورد نظر به صورت الگوی جزء خطای دو جانبه میباشد.

3-7-8

                                                    .

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *