identify_outliers
Funcția este utilizată pentru a identifica valorile outliers dintr-un set de date X, folosind valorile etichetate yval
Prerequisites
Urmatoarele functii sunt necesare pentru rezolvarea task-ului:
Implementare
Funcția va returna valorile outliers (outlier_values
) și indicii acestora (outlier_indices
) în setul de date X
.
calculez valorile medii și matricea de covarianță pentru setul de date X
[mean_values, covariance_matrix] = estimate_gaussian(X);calculez probabilitățile fiecărui exemplu din X de a fi generat de o distribuție gaussiană multivariată,
probabilities = multivariate_gaussian(X, mean_values, covariance_matrix);determin valoarea optimă a pragului (
epsilon
) care maximizează scorulF1
, folosind valorile etichetateyval
și probabilitățile calculate.[epsilon, F1, precision, recall] = optimal_threshold(yval, probabilities);identific outliers.
outlier_indices = find(probabilities < epsilon);
Cod sursa
function [outlier_values, outlier_indices] = identify_outliers(X, yval)
% valori medii si matricea de varianta
[mean_values, covariance_matrix] = estimate_gaussian(X);
% probabilitati folosind multivariate
probabilities = multivariate_gaussian(X, mean_values, covariance_matrix);
% prag optim folosind scor F1
[epsilon, F1, precision, recall] = optimal_threshold(yval, probabilities);
% outliers
outlier_values = find(probabilities < epsilon);
endfunction
Last modified: 30 April 2024