Matplotlib е мощна библиотека за чертане, използвана в езика за програмиране Python. Той предоставя обектно-ориентиран API за вграждане на графики в приложения, които използват GUI инструменти с общо предназначение като Tkinter, wxPython или Qt. Един от важните инструменти, предоставени от Matplotlib, е възможността за създаване на диаграма на доверителния интервал.
Доверителният интервал, като статистически термин, се отнася до степента на сигурност в метода за вземане на проби. Нивото на увереност ви казва колко сигурни можете да бъдете, изразено като процент. Например ниво на достоверност от 99% предполага, че всяка от вашите прогнози за вероятност е вероятно да бъде точна през 99% от времето.
Създаване на диаграма на доверителен интервал с помощта на Matplotlib
Създаването на диаграма на доверителния интервал в Matplotlib включва няколко стъпки. Нека се задълбочим в обяснението на съответния код на Python, за да изпълним тези стъпки:
Първо, трябва да импортираме необходимите библиотеки:
import matplotlib.pyplot as plt import numpy as np from scipy.stats import sem, t from scipy import mean
Сега можем да изчислим доверителния интервал, следвайки тези стъпки.
1. Определете произволен набор от данни, за който ще изчислим доверителния интервал.
2. Изчислете средната и стандартната грешка на набора от данни.
3. Определете границата на грешка за доверителния интервал.
4. Накрая изчислете диапазона на доверителния интервал.
Ето кода на Python, съответстващ на тези стъпки.
confidence = 0.95 data = np.random.rand(100) n = len(data) m = mean(data) std_err = sem(data) h = std_err * t.ppf((1 + confidence) / 2, n - 1) start = m - h end = m + h
Променливата „confidence“ е нивото на достоверност, изразено като процент, а „data“ съдържа произволния набор от данни. Средната и стандартната грешка се изчисляват съответно от функцията „mean“ и „sem“ на библиотеката SciPy. Границата на грешка „h“ се определя чрез умножаване на стандартната грешка по t-резултата, който извличаме от t-разпределението с помощта на функцията „ppf“. И накрая, изчисляваме диапазона на доверителния интервал.
График на доверителния интервал в Matplotlib
В този последен раздел на кода ние използваме Matplotlib, за да визуализираме доверителния интервал.
plt.figure(figsize=(9,6)) plt.bar(np.arange(len(data)), data) plt.fill_between(np.arange(len(data)), start, end, color='b', alpha=0.1) plt.title('Confidence Interval') plt.show()
Той използва лентова диаграма за показване на данните и метода „fill_between“ за представяне на доверителния интервал. Функцията 'figure' инициализира нова фигура, а функцията 'show' представя графиката.
Създаване на диаграма на доверителния интервал в Matplotlib е удобен начин за визуален анализ на вашите данни, особено данни, които включват статистически анализ. Този мощен инструмент предлага лесен и интуитивен начин за представяне на сложни данни във форма, която може лесно да се интерпретира, което го прави основен инструментариум за всеки анализатор на данни или учен на Python. Като разберем как да манипулираме и използваме това, можем да направим процеса на тълкуване на данни по-ефективен и точен.