Makine öğrenimi yaşam döngüsündeki ilk zorluğu, sorunu veya fırsatı anlayıp sonraki modelleme aşaması için veri toplama, anlama ve hazırlamadır. Bu ikinci aşama ise bir makine öğrenimi projesi için ayrılan sürenin %50'den fazlasını aldığı tahmin edilmektedir.
Bu eğitim, problem ifadesinin nasıl çevrileceğini, veri kaynaklarını tanımlamayı, ilişkiler ve kalıplar için verileri keşfetmeyi, model için başlangıç girişlerini tanımlamayı, verileri hazırlamayı ve model montaj işlemi için doğrulamayı ele almaktadır.