Data preparation, filtering and transformation