Este curso te brindar谩 los conocimientos necesarios para la extracci贸n, limpieza y preparaci贸n de distintas fuentes de datos para ser incluidos en un proceso de NLP.
Para realizar este curso es necesario contar con conocimientos de programaci贸n de nivel b谩sico a medio, deseablemente conocimiento b谩sico del lenguaje Python y es recomendable conocer el entorno de Jupyter Notebooks del entorno Anaconda.
Para desarrollar aplicaciones se va a utilizar Python 3.6 o superior. Alternativamente se puede utilizar el entorno de Anaconda con la misma versi贸n de Python.
Como editor de c贸digo, los ejemplos van a ser editados en el Notebook de Anaconda, pero el alumno puede utilizar cualquier editor de texto que reconozca notebooks de Anaconda.
Librer铆as que es necesario tener instaladas para realizar el curso: NLTK, Pandas, Scikit-learn y librer铆as de extracci贸n de datos.