A disputa (ou manipulação) de dados transforma os dados brutos em um formato estruturado para análise. O processo envolve:
- Coletando dados de diferentes fontes.
- Resolver erros e inconsistências.
- Transformando os dados em um formato utilizável.
O processo de organização de dados lida com valores ausentes, exclui pontos de dados duplicados e converte tipos de dados em um formato apropriado. Depois, os dados estão prontos para outras tarefas, como aprendizado de máquina ou análise estatística.