En estadística descriptiva, un diagrama de caixa[1] (en anglès box plot o boxplot) és un gràfic, basat en quartils, amb què es representa la distribució de freqüències o de probabilitat d'una variable a partir d'un conjunt de dades.[2] Permet examinar visualment i de manera ràpida aquest conjunt de dades, així com comparar-ne més d'un.
Està constituït per un rectangle, la "caixa", i dos braços, els "bigotis", i el conjunt se situa damunt la recta de possibles valors de la variable. La caixa representa el recorregut interquartílic, té l'extrem inferior al quartil Q1 i el superior al quartil Q3. Dins la caixa, una banda representa el quartil Q2 o mediana. Els bigotis s'estenen des de cada un dels extrems de la caixa fins als valors mínim Li i màxim Ls de les dades dins d'un interval considerat d'observacions típiques. Una tria comuna per aquest interval és entre i , amb , que és l'amplitud interquartílica (IQR són sigles de l'anglès interquartile range). Les dades que queden fora d'aquest interval es consideren observacions atípiques i es representen, si n'hi ha, amb petits cercles o asteriscs.[3]
És un gràfic, doncs, que subministra la informació dels valors mínim i màxim, dels quartils Q1, Q2 o mediana i Q3, dels valors extrems en l'interval d'observacions típiques, i de les dades atípiques. Amb aquestes dades, n'hi ha prou per veure a cop d'ull aspectes importants de la distribució: per exemple, que la mediana no estigui centrada en el rectangle indica una distribució asimètrica. Té l'avantatge que permet la representació en poc espai, de forma que se'n poden comparar molts a la vegada. Altres gràfics que permeten estimar la distribució són l'histograma o l'estimació de densitat basada en nuclis, amb avantatges diferents.
+-----+-+ * o |-------| | |---| +-----+-+
+---+---+---+---+---+---+---+---+---+---+---+---+ 0 5 10 12