آزمون t چیست و در چه مواقعی استفاده می‌شود؟

  1. خانه
  2. مقالات
  3. آزمون t چیست و در چه مواقعی استفاده می‌شود؟

آزمون t چیست و در چه مواقعی استفاده می‌شود؟

آزمون t ابزاری برای ارزیابی میانگین یک یا دو جامعه آماری با استفاده از آزمون فرضیه است و یکی از ساده‌ترین تکنیک‌های آماری است. این تست برای ارزیابی وجود تفاوت آماری بین حداکثر دو نمونه مختلف استفاده می‌شود و برای اندازه‌گیری متغیرهایی مثل قد، درآمد، یا وزن که به صورت عددی هستند، استفاده می‌شود. اگر بخواهیم بیش از دو گروه را مقایسه کنیم، تست تی کاربرد ندارد. در این حالت، از روش‌هایی مانند ANOVA استفاده می‌کنیم که قادر به مقایسه چندین گروه با هم هستند. در ادامه قرار است بطور کامل بررسی کنیم که تی تست چیست و در چه مواقعی و چطور محاسبه می‌شود، با ما همراه باشید.

داده کاوی با پایتون
 ۷۴۰ نفر  ۸ساعت

۷۰۰,۰۰۰ تومان
خرید دوره

آزمون تی چیست؟

آزمون تی یا t-test (که به نام Student’s t-test نیز شناخته می‌شود) این امکان را به ما می‌دهد که بفهمیم آیا دو گروه از نظر آماری تفاوت دارند یا خیر. به عبارتی تست تی برای بررسی صحت یک فرضیه در زمینه‌های آماری استفاده می‌شود. به عنوان مثال، اگر فرض کنیم که دو روش آموزشی تأثیر مشابهی بر نمرات دانش‌آموزان دارند، آزمون t می‌تواند به ما بگوید آیا واقعاً این دو روش تفاوت معناداری دارند یا خیر.

 در این روش، ما ابتدا با استفاده از فرمول‌های خاصی مقادیری را محاسبه می‌کنیم و سپس آن‌ها را با مقادیر استاندارد مقایسه می‌کنیم. اگر نتیجه محاسبات نشان دهد که تفاوت‌های مشاهده شده بزرگتر از حدی هستند که به صورت تصادفی اتفاق افتاده باشند، فرضیه صفر (که می‌گوید هیچ تفاوتی وجود ندارد) رد می‌شود.

با توجه به نوع داده‌هایی که دارید، نوع مختلفی از تی تست باید اجرا شود. برای مثال، اگر نمونه‌های شما وابسته به هم هستند (مثلا، اندازه‌گیری وزن افراد قبل و بعد از یک رژیم غذایی خاص)، باید از آزمون t جفتی استفاده کنید. اما اگر دو گروه مختلف و مستقل از هم دارید (مانند دانش‌آموزان دو مدرسه متفاوت)، آزمون تی دو نمونه مستقل مناسب است.

چه کسانی از آزمون t استفاده می‌کنند؟

آزمون تی تست یکی از ابزارهای متداولی است که توسط کارشناسان تحلیل داده برای بررسی تفاوت‌های آماری بین دو گروه استفاده می‌شود. این روش‌ هم به تنهایی برای تحقیقات ساده کاربرد دارد و هم در تحلیل‌های پیچیده‌تر آماری به عنوان بخشی از مدل‌های بزرگ‌تر مورد استفاده قرار می‌گیرند. اگر پژوهش شما نیاز به مقایسه‌های بیشتری دارد، ممکن است لازم باشد رویکردهای دیگری را در نظر بگیرید که به شما امکان می‌دهد تفاوت‌ها را در سطح وسیع‌تری بررسی کنید.

موارد استفاده از تست t

موارد استفاده از تست t

فرض کنید که یک تولیدکننده دارو، داروی جدیدی را آزمایش می‌کند. طبق روال استاندارد، دارو به یک گروه از بیماران داده می‌شود و به گروه دیگری که گروه کنترل نامیده می‌شوند، دارونما داده می‌شود. دارونما ماده‌ای است که ارزش درمانی ندارد و به عنوان معیاری برای اندازه‌گیری پاسخ گروه دیگری که داروی واقعی را دریافت کرده‌اند، عمل می‌کند.

پس از آزمایش دارو، اعضای گروه کنترل که دارونما دریافت کرده‌اند، افزایش متوسط عمر به مدت سه سال را گزارش دادند، در حالی که اعضای گروهی که داروی جدید تجویز شده بود، افزایش متوسط عمر به مدت چهار سال را گزارش کردند.

مشاهدات اولیه نشان می‌دهد که دارو موثر است. با این حال، امکان دارد که این مشاهدات به دلیل شانس باشد. تی تست می‌تواند برای تعیین اینکه آیا نتایج صحیح بوده و قابل اعمال به کل جمعیت هستند، استفاده شود.

این آماره t بر چهار فرض اساسی استوار است: 

  1. داده‌ها باید نوع خاصی داشته باشند که قابل اندازه‌گیری و مقایسه باشند.
  2. داده‌ها باید از یک نمونه تصادفی از جمعیت گرفته شوند تا نتایج عمومی‌تر باشند.
  3. داده‌ها باید به شکل منحنی زنگی توزیع شوند.
  4. نوسانات در داده‌ها باید یکسان باشند تا نتایج قابل مقایسه باشند. 

این فرض‌ها به ما اطمینان می‌دهند که تحلیل‌های ما دقیق و قابل اتکا هستند.

فرضیات مورد نیاز آزمون t

برای انجام تست تی نیاز است که فرضیات زیر در نظر گرفته شده و برآورده شوند:

  • متغیر مورد علاقه: این آزمون t همانند همبستگی یا رگرسیون نیست که در آن به رابطه بین چندین متغیر بپردازید. با آزمون تی تست، شما ممکن است نمونه‌های مختلفی داشته باشید، اما همه آن‌ها یک متغیر مشابه را اندازه‌گیری می‌کنند (مثلاً قد).
  • داده‌های عددی: شما با لیستی از اندازه‌گیری‌ها سر و کار دارید که می‌توانند میانگین گرفته شوند. 
  • دو گروه یا کمتر: اگر بیش از دو نمونه داده دارید، آماره t تکنیک درستی برای شما نیست
  • نمونه تصادفی: شما نیاز به نمونه‌ای تصادفی از «جمعیت آماری مورد علاقه» خود دارید تا بتوانید نتیجه‌گیری‌های معتبری درباره جمعیت بزرگ‌تر داشته باشید. اگر جمعیت شما آنقدر کوچک است که می‌توانید همه چیز را اندازه‌گیری کنید، در این صورت شما یک «سرشماری» دارید و به آمار نیاز ندارید. 
  • توزیع نرمال: هرچه اندازه نمونه شما کوچک‌تر باشد، اهمیت بیشتری دارد که داده‌های شما از یک توزیع نرمال با منحنی زنگوله‌ای داشته باشند. داده‌ها باید از نمونه‌ای تصادفی از جمعیت انتخاب شوند تا نتایج قابل تعمیم به کل جمعیت باشند. اگر داده‌ها از توزیع نرمال پیروی نکنند، مخصوصا در نمونه‌های کوچک، ممکن است نتایج تحریف شوند، پس در این صورت باید از روش‌های آماری غیر پارامتریک استفاده کرد.

پایگاه داده مقدماتی
 ۱۰۶۲ نفر  ۱۰ساعت

۵۰۰,۰۰۰ تومان
خرید دوره

فرمول انواع آزمون تی تست 

محاسبه آزمون تی نیازمند سه مقدار داده اساسی است. این مقادیر شامل تفاوت بین میانگین‌های هر مجموعه داده یا تفاوت میانگین، انحراف استاندارد هر گروه و تعداد داده‌های هر گروه است.

این مقایسه به تعیین تاثیر شانس بر روی تفاوت کمک می‌کند و به ما می‌گوید که آیا تفاوت خارج از دامنه شانس است یا نه؟

برای انجام این تست، سه چیز مهم نیاز است: 

  1. تفاوت میانگین‌های دو گروه
  2. انحراف معیار هر گروه (که نشان‌دهنده پراکندگی داده‌ها است)
  3. تعداد داده‌های هر گروه

با استفاده از این اطلاعات، مقدار تی محاسبه می‌شود که نشان‌دهنده اندازه تفاوت بین دو گروه است. مقدار تی سپس با مقادیر استانداردی که در جدول‌های آماری موجود است مقایسه می‌شود تا ببینیم آیا تفاوت‌ها فراتر از آنچه ممکن است به طور تصادفی اتفاق بیفتد، هستند یا خیر. اگر مقدار تی بالا باشد، نشان‌دهنده تفاوت قابل توجهی است؛ اگر پایین باشد، نشان‌دهنده شباهت زیاد بین دو گروه است.

۱. آزمون تی برای نمونه‌های جفتی (Paired Sample T-Test)

آزمون t جفتی یک روش آزمون است که در شرایط خاصی به کار می‌رود، جایی که دو مورد یا دو گروه داده‌ها را می‌توان به طور مستقیم با هم مقایسه کرد زیرا آن‌ها به نحوی مرتبط هستند. مانند مواقعی مانند یک فرد قبل و بعد از یک درمان، یا کودکان در یک خانواده که با والدین یا خواهر و برادران خود مقایسه شده و مورد آزمایش قرار می‌گیرند. در این نوع آزمون، هر واحد یا فرد به عنوان کنترل خود عمل می‌کند و این اجازه می‌دهد تا تاثیر مستقیم یک تغییر یا درمان را بر همان فرد بررسی کنیم.

این آزمون به خصوص برای مواردی که تکرار در داده‌ها وجود دارد یا زمانی که دو گروه دارای ویژگی‌های بسیار نزدیک به هم هستند، مناسب است. آماره t جفتی کمک می‌کند تا با دقت بیشتری تفاوت‌های قبل و بعد از یک تغییر را در همان نمونه‌ها تجزیه و تحلیل کنیم.

در نتیجه، این نوع آزمون تی به شناسایی تفاوت‌های واقعی در شرایط کنترل شده و محدود کمک می‌کند، به خصوص زمانی که می‌خواهیم اثربخشی یک تغییر خاص را بر روی یک فرد یا مورد مشخص بررسی کنیم.

فرمول محاسبه مقدار تی و درجات آزادی برای آزمون t جفتی به این صورت است:

آزمون تی برای نمونه‌های جفتی (Paired Sample T-Test)

که در آن:

mean1 و mean 2 = میانگین مقادیر هر یک از مجموعه‌های نمونه 

s(diff) = انحراف استاندارد تفاوت مقادیر داده های جفت شده

n = اندازه نمونه (تعداد تفاوت های زوجی

n-1 = درجات آزادی

۲. آزمون تی با واریانس برابر (Equal Variance or Pooled T-Test)

آزمون تی تست با واریانس برابر، که گاهی اوقات به آن آزمون تی تجمعی نیز گفته می‌شود، در مواردی استفاده می‌شود که دو گروهی که قصد مقایسه‌شان را داریم، دارای تعداد نمونه‌های یکسان یا واریانس‌های بسیار نزدیک به هم باشند. این شرایط اطمینان می‌دهد که داده‌های هر دو گروه از لحاظ آماری در شرایط مشابهی قرار دارند، بنابراین می‌توان از یک فرمول استاندارد برای محاسبه تفاوت‌های میانگین بین آن‌ها استفاده کرد.

این روش آماری بر این فرض استوار است که تغییرپذیری در داده‌ها در هر دو گروه به طور کلی برابر است، بنابراین محاسبات و تحلیل‌های نتایج به دقت بیشتری انجام می‌پذیرد. این آزمون t برای مطالعاتی که در آن‌ها کنترل دقیقی بر توزیع نمونه‌ها وجود دارد مناسب است و به تحقیقات دقیق‌تر و قابل اعتمادتر کمک می‌کند. فرمول مورد استفاده برای محاسبه مقدار تی و درجات آزادی برای آزمون t با واریانس برابر به این صورت است:

آزمون تی با واریانس برابر (Equal Variance or Pooled T-Test)

که در آن:

mean1 و mean 2 = میانگین مقادیر هر یک از مجموعه‌های نمونه 

var1 و var2 = واریانس هر یک از مجموعه های نمونه

​n1 و n2= تعداد رکوردها در هر مجموعه نمونه

و 

آزمون تی با واریانس برابر (Equal Variance or Pooled T-Test)

که در آن:
​n1 و n2= تعداد رکوردها در هر مجموعه نمونه

۳. تست تی با واریانس نابرابر (Unequal Variance T-Test)

تست تی با واریانس نابرابر یک نوع خاص از تست‌های تی است که برای مقایسه دو گروه با شرایط ناهمگون مورد استفاده قرار می‌گیرد. این آزمون زمانی به کار برده می‌شود که دو گروه تحقیق دارای تعداد نمونه‌های متفاوت و واریانس‌های متفاوتی باشند. به بیان دیگر، اگر دو گروه مورد بررسی تفاوت‌هایی در تنوع داده‌ها یا اندازه نمونه‌ها داشته باشند، از این آزمون تی تست استفاده می‌شود تا از تحریف نتایج جلوگیری شود.

آزمون تی تست ولچ، که با نام آزمون تی با واریانس نابرابر نیز شناخته می‌شود، فرمول خاصی برای محاسبه دارد که شامل بررسی میانگین‌ها و واریانس‌های هر دو گروه است و به طور خاص برای اطمینان از دقت در شرایط ناهمگون طراحی شده است.

این فرمول به ما امکان می‌دهد تا ببینیم آیا تفاوت‌های مشاهده شده بین دو گروه از نظر آماری معنادار هستند یا خیر، حتی اگر شرایط داده‌ها متفاوت باشد.

فرمول مورد استفاده برای محاسبه مقدار تی و درجات آزادی برای آماره t با واریانس نابرابر به این صورت است:

تست تی با واریانس نابرابر (Unequal Variance T-Test)

که در آن:

mean1 و mean 2 = میانگین مقادیر هر یک از مجموعه‌های نمونه 

var1 و var2 = واریانس هر یک از مجموعه های نمونه

​n1 و n2= تعداد رکوردها در هر مجموعه نمونه

تست تی با واریانس نابرابر (Unequal Variance T-Test)

که در آن:
var1 و var2 = واریانس هر یک از مجموعه های نمونه

​n1 و n2= تعداد رکوردها در هر مجموعه نمونه

کدام تی تست را استفاده کنیم؟

کدام تی تست را استفاده کنیم؟

برای انتخاب نوع مناسب تی تست، باید نمودار جریانی را دنبال کنید که بر اساس خصوصیات نمونه‌های داده‌ای که دارید تنظیم شده است. سه فاکتور اصلی که باید بررسی کنید عبارتند از: 

  • شباهت داده‌ها در نمونه‌ها
  • تعداد داده‌ها در هر نمونه
  • میزان تغییرپذیری یا واریانس داده‌ها در هر نمونه. 

به زبان ساده‌تر، این سه فاکتور به ما کمک می‌کنند تا تشخیص دهیم که کدام نوع تی تست برای آزمایش فرضیه‌مان مناسب است، بر اساس اینکه آیا نمونه‌های ما به هم شبیه هستند، چه تعداد داده دارند و چقدر نسبت به هم متفاوتند. این موارد به ما کمک می‌کند تا دقیق‌تر و مناسب‌تر تصمیم‌گیری کنیم در مورد اینکه کدام آزمون آماری را انجام دهیم.

جدول توزیع تی چگونه استفاده می‌شود؟

جدول توزیع تی، که یک ابزار مهم در آمار است، به دو شکل ارائه می‌شود: 

  1. یک‌دمی 
  2. دو دمی

نوع یک‌دمی زمانی استفاده می‌شود که ما به دنبال ارزیابی احتمال رخ دادن یک واقعه در یک جهت خاص هستیم، مانند اینکه آیا یک مقدار خاص مثبت خواهد بود یا منفی. به عنوان مثال، اگر بخواهیم بدانیم احتمال اینکه نتیجه‌ای که از پرتاب دو تاس به دست می‌آید بیشتر از هفت باشد، چقدر است.

نوع دو دمی برای مواردی استفاده می‌شود که می‌خواهیم تحلیل کنیم چه اتفاقی می‌افتد اگر یک متغیر در یک محدوده خاص بماند. برای مثال، اگر بخواهیم تعیین کنیم که آیا مختصاتی که داریم بین منفی ۲ و مثبت ۲ قرار دارند یا نه. این کمک می‌کند برای موقعیت‌هایی که نتایج ما ممکن است در یک محدوده مشخص جای گیرند و ما می‌خواهیم احتمال وقوع آن‌ها را در این محدوده بسنجیم.

بوت کمپ پایتون و هوش مصنوعی
 ۵۷۷ نفر  ۹۸ساعت

۴,۰۰۰,۰۰۰ تومان
خرید دوره

آشنایی با مسیر یادگیری کارشناس تحلیلگر داده

تی-تست یک روش در آمار است که به ما کمک می‌کند تا بفهمیم آیا دو گروه مختلف از نظر میانگین‌هایشان با هم تفاوت دارند یا نه. به عبارت دیگر، اگر ما می‌خواهیم بدانیم که یک دارو یا روش درمانی جدید تأثیری بر بهبود بیماران دارد یا نه، می‌توانیم از تی-تست استفاده کنیم. ما دو گروه را در نظر می‌گیریم: یک گروه که داروی جدید را دریافت می‌کنند و گروه دیگری که دارویی دریافت نمی‌کنند یا داروی معمولی می‌گیرند. سپس، میانگین نتایج هر دو گروه را مقایسه می‌کنیم تا ببینیم آیا تفاوت معنی‌داری وجود دارد یا خیر. این کمک می‌کند تا ما درک بهتری از تأثیرات دارو یا درمان جدید بدست آوریم.

همانطور که اشاره کردیم، تحلیلگران داده از آزمون t برای مقایسه دو گروه داده از آن استفاده می‌کنند. یک تحلیلگر داده نقشی کلیدی در بهبود فرآیندها و تصمیم‌گیری‌های استراتژیک در سازمان‌ها دارد. این فرد یکی از مهم‌ترین اعضای هر تیم است که با استفاده از تکنیک‌های پیشرفته آماری و ریاضی، داده‌های بزرگ را تحلیل کرده و به شرکت‌ها و سازمان‌ها کمک کند از این داده‌ها به نحو احسن استفاده کنند.

اگر به فعالیت در این حوزه علاقه دارید، دوره تخصصی کارشناس تحلیلگر داده که توسط آکادمی همراه برگزار شده است، یک فرصت استثنایی است.

شما در این دوره یاد خواهید گرفت چگونه داده‌ها را به دیدگاه‌های قابل درک تبدیل کنید و چگونه با استفاده از این دیدگاه‌ها به سازمان‌ها کمک کنید تا تصمیم‌گیری‌های هوشمندانه‌تری داشته باشند. برای اطلاعات بیشتر به صفحه «مسیر یادگیری کارشناس تحلیلگر داده» سر بزنید.

منابع: 

یک پاسخ

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

شماره همراه شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند

جدیدترین مطالب

موضوعات داغ

دوره‌های مرتبط

مقالات مرتبط