NLP
Introdução ao Processamento Natural de Linguagem
Aula 01 - O que é Processamento Natural de Linguagem
Aula 02 - Aplicações e Tarefas
Aplicações de NLP - Aula Inaugural do Curso de Processamento oferecido pela USP - Um pouco longo, traz um pouco da criação dos primeiros corretores em língua portuguesa.
Expressões Regulares
Ferramentas online para exercitar expressões regulares
https://regex-generator.olafneumann.org/ : Gerar "autômato" e código
Sequência de Vídeos sobre Expressões Regulares da UFMG
Aula 01 - Introdução às Expressões Regulares
Aula 02 - Expressões Regulares: Disjunção
Aula 03 - Expressões Regulares: Múltiplos Padrões e Marcadores
Aula 04 - Expressões Regulares: Quantificadores
Aula 05 - Expressões Regulares: Agrupamento e Substituição
Aula 06 - Expressões Regulares: Caracteres Especiais e Avaliação
Materiais Didáticos
Material da W3School: Visão geral, rápida e com exercícios.
Similaridade Entre Palavras
O assunto principal é sobre a distância de Levenshtein
Aula 01 - Distância de Edição, Introdução UFMG
Aula 02 - Distância de Edição: Exemplos em Python
Aula 03 - Distância de Edição: Aplicações
Modelos Avançados
BERT
Transformers
Aplicações e Hands On
Computer Science Master: Contém alguns códigos em Python sobre temas como Bag Of Words, Word2Vec, TF-IDF, entre outros.
Sites, Playlists e Links Úteis
Material da UFMG do Curso de Processamento de Linguagem Natural
PlayList do curso completo de Linguística Computacional da UFMG
Playlists em Português - Selecionadas
Processamento de Linguagem Natural - Aprendiz do Futuro: Técnicas avançadas, transcoder, BERT, GPT3, RNN, ...
Processamento de Linguagem Natural - IA Expert: NLTK, BERT, PageRank, Mineração de Texto, Remoção de StopWords, ...
Artigos/Teses/Dissertações/TCCs de Referência
[1] MIKOLOV, Tomas et al. Efficient estimation of word representations in vector space. arXiv preprint arXiv:1301.3781, 2013.
[2] BUDANITSKY, Alexander; HIRST, Graeme. Evaluating wordnet-based measures of lexical semantic relatedness. Computational linguistics, v. 32, n. 1, p. 13-47, 2006.
[3] Oram, P. (2001). WordNet: An electronic lexical database. Christiane Fellbaum (Ed.). Cambridge, MA: MIT Press, 1998.
Projetos de NLP
Centro de Linguística da Universidade de Lisboa: Contém corpus, ferramentas, wordnet em português entre outros.
Association for Computational Linguistics - organização internacional que representa o campo de NLP. Contém diversos recursos tais como conferências e workshops na área, WIKI com diversos recursos, Antologia com a literatura da área de mais de 50 anos.
LanguageLog Blog com posts relacionados a NLP
Sociedade Internacional de Linguística. Internacional Brasil
Linguistica Data Consortium - TreeBank da Universidade da Pensilvânia
European Language Resources Agency com diversos textos anotados
Sites de Consulta
Introdutórios
O que é e qual sua importância by SAS (Português)
Uma mergulhada na NLP : Visão Geral e bem ilustrado com timeline. Em Inglês. Parte 01 Parte 02
Timeline
Vídeos de Machine Learning sobre NLP
Bibliotecas em Python
Breve referência de Ferramentas para NLP para Python
WordEmbeddings
Livros na Área
[1] RAO, Delip; MCMAHAN, Brian. Natural language processing with PyTorch: build intelligent language applications using deep learning. " O'Reilly Media, Inc.", 2019.
[4] Bird, S., Klein, E., & Loper, E. (2009). Natural language processing with Python: analyzing text with the natural language toolkit. " O'Reilly Media, Inc.".