O Processamento de Linguagem Natural (PNL) é um campo de inteligência artificial que permite aos computadores analisar e entender a linguagem humana. Foi formulado para criar software que gera e compreende linguagens naturais para que um usuário possa ter conversas naturais com seu computador, em vez de através de programação ou linguagens artificiais como Java ou C.
Quebrando o processamento da linguagem natural (PNL)
O Processamento de Linguagem Natural (PNL) é um passo em uma missão maior para o setor de tecnologia - a saber, usar a inteligência artificial (IA) para simplificar a maneira como o mundo funciona. O mundo digital provou ser um divisor de águas para muitas empresas, à medida que uma população cada vez mais conhecedora de tecnologia encontra novas maneiras de interagir on-line entre si e com as empresas. A mídia social redefiniu o significado de comunidade; a criptomoeda mudou a norma de pagamento digital; O comércio eletrônico criou um novo significado para a palavra conveniência e o armazenamento em nuvem introduziu outro nível de retenção de dados para as massas.
Através da IA, campos como aprendizado de máquina e aprendizado profundo estão abrindo os olhos para um mundo de todas as possibilidades. O aprendizado de máquina está sendo cada vez mais usado na análise de dados para entender o big data. Também é usado para programar chatbots para simular conversas humanas com os clientes. No entanto, essas aplicações avançadas de aprendizado de máquina não seriam possíveis sem a improvisação do Processamento de Linguagem Natural (PNL).
Como a PNL realmente funciona?
A PNL combina IA com linguística computacional e ciência da computação para processar idiomas e fala humana ou natural. O processo pode ser dividido em três partes. A primeira tarefa da PNL é entender a linguagem natural recebida pelo computador. O computador usa um modelo estatístico interno para executar uma rotina de reconhecimento de fala que converte a linguagem natural em uma linguagem de programação. Ele faz isso dividindo um discurso recente que ouve em unidades minúsculas e, em seguida, compara essas unidades às unidades anteriores de um discurso anterior. A saída ou resultado em formato de texto determina estatisticamente as palavras e frases que provavelmente foram ditas. Essa primeira tarefa é chamada de processo de fala para texto.
A próxima tarefa é chamada de marcação de parte do discurso (POS) ou desambiguação de categoria de palavra. Esse processo identifica elementarmente as palavras em suas formas gramaticais como substantivos, verbos, adjetivos, tempo passado etc. usando um conjunto de regras de léxico codificadas no computador. Após esses dois processos, o computador provavelmente agora entende o significado do discurso que foi feito.
O terceiro passo dado por uma PNL é a conversão de texto em fala. Nesse estágio, a linguagem de programação do computador é convertida em um formato audível ou textual para o usuário. Um chatbot de notícias financeiras, por exemplo, que faz uma pergunta como "Como está o Google hoje?" Provavelmente examinará sites de finanças on-line em busca de ações do Google e poderá decidir selecionar apenas informações como preço e volume como resposta.
A PNL tenta tornar os computadores inteligentes, fazendo os humanos acreditarem que estão interagindo com outro humano. O teste de Turing, proposto por Alan Turing em 1950, afirma que um computador pode ser totalmente inteligente se puder pensar e fazer uma conversa como um humano sem que o humano saiba que está conversando com uma máquina. Até agora, apenas um computador passou no teste - um chatbot com a personalidade de um garoto de 13 anos. Isso não quer dizer que é impossível construir uma máquina inteligente, mas descreve as dificuldades inerentes a fazer um computador pensar ou conversar como humano. Como as palavras podem ser usadas em diferentes contextos, e as máquinas não têm a experiência da vida real que os humanos têm para transmitir e descrever entidades em palavras, pode demorar um pouco mais para que o mundo possa acabar completamente com a linguagem de programação de computadores.
