Apache Samza adalah kerangka terbuka (framework open-source) untuk pemrosesan terdistribusi aliran data dengan volume tinggi. Tujuan utama dari desainnya adalah untuk mendukung throughput tinggi dalam berbagai pola pemrosesan, sekaligus menjaga keandalan operasional pada skala besar yang dibutuhkan oleh perusahaan berbasis internet. Samza mencapai tujuan ini melalui beberapa abstraksi inti, yaitu log terpartisi untuk messaging, state lokal yang fault-tolerant, dan penjadwalan tugas berbasis klaster.[2]
Awalnya dikembangkan oleh LinkedIn, Samza kemudian disumbangkan ke Apache Software Foundation pada tahun 2013 dan resmi menjadi proyek Apache top-level pada tahun 2015. Saat ini, Samza digunakan di banyak perusahaan teknologi besar seperti LinkedIn, Netflix, Uber, dan TripAdvisor.