import numpy as np
import matplotlib.pyplot as plt


dati = np.array([1.95,1.96,1.9,1.9,1.84,1.81,2.06,1.99,1.93,1.97,2.02,1.92,1.95,1.88,1.87,2.03,1.85,2.08,1.96,1.81,
                2.07,1.91,1.79,1.99,1.97,1.95,1.96,1.93,1.83,2.09,2.02,2.09,1.84,1.86,1.96,2.03,1.93,1.9,1.94,1.87,
                1.97,1.91,1.87,1.81,2.06,2.02,1.96,1.81,1.93,2.03,1.92,1.96,1.8,1.95,1.9,2.02,2.03,1.9,2.03,2.02,
                1.96,1.9,1.98,1.87,1.9,1.89,1.84,2.06,1.93,2.06,1.93,1.93,1.9,1.9,1.9,1.93,1.86,1.83,1.96,1.81,2.03,
                1.98,1.84,1.86,1.96,1.81,1.98,1.84,1.86,1.96,1.92,1.96,1.85,2.04,2,1.92,1.9,2.15,1.94,1.92])


num_elementi = dati.size
num_elementi

100


dati_sq = dati*dati


media1 = dati.sum()/num_elementi
media1


media2 = dati.mean()
media2

1.9357


varianza1 = (dati_sq - 2.*media1*dati + media1*media1).sum()/num_elementi # Notice array + const*array + const
varianza1


varianza2 = dati.var()
varianza2


deviazione_std1 = np.sqrt(varianza2)
deviazione_std1


deviazione_std2 = dati.std()
deviazione_std2

0.07747586721037715


dati1 = np.array([n for n in dati if np.absolute(n - media1) < deviazione_std1])


dati1.size


min = dati.min()
min


max = dati.max()
max


nbins = 10
xrange = (1.75,2.20)


fig, ax = plt.subplots()
nevent, bins, patches = ax.hist(dati, nbins, range=xrange)
ax.plot(np.ones(2)*media2,[0,nevent.max()+1],label="media")
ax.plot(np.ones(2)*media2-deviazione_std2,[0,nevent.max()+1],label="media - $\sigma$")
ax.plot(np.ones(2)*media2+deviazione_std2,[0,nevent.max()+1],label="media + $\sigma$")
ax.legend();


nevent       # Numero di eventi in ciacun bin


bins         # Estremi dei bin


import matplotlib.pyplot as plt
from numpy.random import default_rng

rng = default_rng()

#help(np.random.default_rng)
#help(rng)


m1 = rng.normal(size=2000)


nbins = 30
xrange = (-5,5)    # ntupla
fig, ax = plt.subplots()
nevent, bins, patches = ax.hist(m1, nbins, range=xrange)


m2 = rng.normal(loc=-2., scale=0.3, size=2000)


nbins = 300
xrange = (-5,1)    # ntupla
fig, ax = plt.subplots()
nevent, bins, patches = ax.hist(m2, nbins, range=xrange)


#help(rng.uniform)


m3 = rng.uniform(size=2000)


nbins = 12
xrange = (-0.1,1.1)    # ntupla
fig, ax = plt.subplots()
nevent, bins, patches = ax.hist(m3, nbins, range=xrange)


#help(rng.integers)


m4 = rng.integers(0,high=100,size=20)
m4


rng1 = default_rng(12345)
rng2 = default_rng(12345)


m3_1 = rng1.uniform(size=200)


m3_2 = rng2.uniform(size=200)


m3_1 == m3_2


rng3 = default_rng(12345)
rng4 = default_rng(12345)


m1_1 =rng3.normal(size=1000)
#m1_1


m1_2 =rng4.normal(size=1000)
#m1_2


all(m1_1 == m1_2)


import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt


x = np.linspace(-3,3,100)
y_norm = stats.norm.pdf(x)

fig, ax = plt.subplots()
ax.plot(x,y_norm);


stats.describe(y_norm)

DescribeResult(nobs=100, minmax=(0.0044318484119380075, 0.3987591533537418), mean=0.1645975096425618, variance=0.01964894623903066, skewness=0.4042398613429197, kurtosis=-1.3613112580554971)


y_norm_cumulative = stats.norm.cdf(x)


fig, ax = plt.subplots()
ax.plot(x,y_norm_cumulative);


mu = 1.5
k = np.arange(0,10,1)
n = stats.poisson.pmf(k, mu)


fig, ax = plt.subplots()
ax.scatter(k,n);


stats.describe(n)

DescribeResult(nobs=10, minmax=(2.3638318270467896e-05, 0.33469524022264474), mean=0.09999959024990236, variance=0.015889019294170213, skewness=0.7954958214401758, kurtosis=-0.9316199632660513)

9: Statistica Elementare con Numpy e Matplotlib

9.1 Nozioni fondamentali¶

Imparare Facendo

9.2 Istogramma delle frequenze¶

Imparare Facendo

Attenzione!

9.3 Numeri Casuali¶

Imparare Facendo

9.4 Distribuzioni di probabilità¶

9.4.1 Distribuzione normale: $\,\,N(x) = \frac{\exp (-x^2/2)}{\sqrt{2\,\pi}}$¶

Grafico della distribuzione¶

Parametri del set di dati¶

Grafico della distribuzione cumulativa: $\,\,C(x) = \int_{-\infty}^x N(y)\, dy$¶

9.4.1 Distribuzione di Poisson: $f(k) = \exp(-\mu)\, \frac{\mu^k}{k!}$¶

Grafico della distribuzione¶

Parametri del set di dati¶