CodeSnips

python

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

train_df = pd.read_parquet('train_features.parquet')
prod_df = pd.read_parquet('production_features.parquet')

Statistical visualizations for distribution and drift analysis

seaborn data-drift distributions

by Dr. Elena Vasquez 1 tab

python

import numpy as np
from scipy import stats

control = np.array([21.1, 20.5, 19.9, 22.0, 20.8, 21.4])
treatment = np.array([22.8, 23.0, 22.2, 24.1, 23.5, 22.9])

Hypothesis testing for product experiments in Python

statistics hypothesis-testing scipy

by Dr. Elena Vasquez 1 tab

python

import numpy as np
from statsmodels.stats.proportion import proportions_ztest, confint_proportions_2indep

control_conversions = 920
control_users = 12_500
treatment_conversions = 1_015

A B testing analysis with confidence intervals and guardrails

ab-testing experimentation statistics

by Dr. Elena Vasquez 1 tab