Brincando Expressões Regulares no Python - Mind Bending. Muitas vezes durante o nosso dia-a-dia de programador nos deparamos com a necessidade de analisar, buscar e retornar valores dentro de uma string . Existem duas formar de se fazer esse processamento, uma é você escrever manualmente a análise da string e a outra é utiliza expressões regulares , ou como também são chamadas: RegEx (abreviação para Regular Expressions ) Expressões Regulares Expressões regulares são uma cadeia de caracteres com significados próprios utilizados para buscar padrões de texto. Elas possuem diversas aplicações, mas geralmente são utilizadas para extrair informações de um texto ou saber se um grupo predefinido de sequência está presente em um texto.
Um Exemplo Simples As expressões regulares são ferramentas extremamente poderosas e podem passar de trechos simples de caracteres à um emaranhado ininteligível de caracteres, por isso use com parcimônia. Neste nosso exemplo temos uma string chamada dados que contém um pequeno trecho HTML. . #! #! Por Que Não? #! Só Isso? [Python] Tutorial de regex by PyTeam. Senhoras e senhores, aqui está o tão aguardado...GUIA DO ROLANDO2424 PARA REGEX (Ex... ex... x...) <--- Fadeoutem Python Antes de começar a chatear a cabeça às pessoas, é melhor eu dizer umas coisinhas sobre Regex (também conhecidas por Regular Expressions).Regexs não é complicado de escrever, pode ser complicado é de ler as regexs feitas pelos outros (existe uma maneira de atenuar/evitar essa situação que eu vou explicar mais para a frente, mas se são impacientes, procurem por re.VERBOSE aqui no guia, que não falham).Regexs não é a cura para todos os males.
O que quero dizer é que nem sempre regexs são a melhor maneira de atacar um problema. Existe um ditado (o livro onde isso está escrito está na casa-de-banho e não me apetece ir lá ) que é algo assim "When confronted with a problem, people often think 'I know, I'll use Regular Expressions'. Now they have two problems. " Vamos começar pelo início. O que é de facto uma regex. Código (Python): >>> import re E está feito. Eles são: OPS! O "? "
Beautiful Soup e HTML Scrapping em Python. Fazer o parsing de uma página HTML que está corretamente formatada como XHTML em Python é fácil: podemos usar o módulo minidom ou, dependendo da situação, o (c)ElementTree. Mas, e se a página não está tão corretamente formatada assim? Aí entra em cena um módulo muito interessante: o Beautiful Soup. Segundo a definição no site:O Beautiful Soup é um parser de HTML/XML para Python que pode transformar até mesmo marcação inválida em uma árvore analítica. Ele provê um modo idiomático de navegar, procurar e modificar a árvore de elementos.
Ele normalmente salva o programador de horas ou dias de trabalho. Existe também um porte para Ruby chamado Rubyful Soup. Um pequeno exemplo prático: vamos obter a lista das 20 linguagens de programação listadas no tiobe. Tentar fazer o parsing dessa HTML com o minidom gera uma bela exceção: >>> dom3 = parseString(html)Traceback (most recent call last): File " Ao invés disso, vamos usar o Beautiful Soup: import urllib2from BeautifulSoup import BeautifulSoup. Criando Web crawlers em Python – Parte II | Herberth Amaral.
Def Python():: Trabalhando com strings. Só pra não deixar o blog parado, vamos dar uma pequena olhada no que o Python pode fazer com strings, apenas alguns métodos. Primeiro vale lembra que em Python, tudo são objetos, então uma string também é um objeto, e tem varios metodos embutidos que facilitam seu manuseio e formatação. Não é preciso declarar variáveis, então para criar uma string, basta atribuir: >>> nome = 'igor'>>> nome'igor' Ou para tornar um outro tipo em string: >>> numero = 12.45>>> string = str(numero)>>> string'12.45' As strings possuem aspas simples ou duplas, para o caso de precisarmos de algumas delas dentro da própria string: >>> nome = "meu nome é 'igor' ">>> nome"meu nome é 'igor' " E se quisermos escrever uma string usando varias linhas: >>> nome = ''' estou... aprendendo... python'''>>> nome'estou\n aprendendo\n python' Note que um carácter quebra de linha (\n) é adicionado automaticamente com o Enter.Agora vamos brincar com letras maiúsculas e minúsculas: >>>nome = 'python'>>> nome.find('t')2.
ManipulandoStringsComPython - PythonBrasil. Por: Peyton McCullough original: DevShed Esse artigo vai dar uma geral nos vários métodos de manipular uma string, cobrindo coisas de métodos básicos até expressões regulares em Python. Manipular uma string é uma técnica que todo programador Python devia se familiarizar. O jeito mais básico de manipular strings é através de métodos que estão dentro delas (strings). Podemos fazer um limitado número de tarefas em strings através desses métodos.
>>> test = 'This is just a simple string.' Vamos dar uma volta rápida e usar a função len. >>> len(test) 29 Beleza, agora vamos voltar aos métodos que eu estava falando.Vamos pegar nossa string e substituir uma palavra usando o método replace. >>> test = test.replace('simple', 'short') >>> test 'This is just a short string.' Agora vamos contar o numero de vezes que a palavra especificada aparece na string, nesse caso estou apenas procurando por um caracter 'r'.
>>> test.count('r') 2 Podemos também achar em que posição está certa levra ou palavra. Dobrando o Python Com Expressões Regulares - Mind Bending.