background preloader

TAL

Facebook Twitter

Introduction — Selenium 2.0 documentation. Selenium Python Client Driver is a Python language binding for Selenium Remote Control (version 1.0 and 2.0). Currently the remote protocol, Firefox and Chrome for Selenium 2.0 are supported, as well as the Selenium 1.0 bindings. As work will progresses we’ll add more “native” drivers. See here for more information. Example from selenium import webdriverfrom selenium.common.exceptions import NoSuchElementExceptionfrom selenium.webdriver.common.keys import Keysimport time browser = webdriver.Firefox() # Get local session of firefoxbrowser.get(" # Load pageassert "Yahoo! " in browser.titleelem = browser.find_element_by_name("p") # Find the query boxelem.send_keys("seleniumhq" + Keys.RETURN)time.sleep(0.2) # Let the page load, will be added to the APItry: browser.find_element_by_xpath("//a[contains(@href,' NoSuchElementException: assert 0, "can't find seleniumhq"browser.close()

3. Navigating — Selenium Python Bindings 2 documentation. The first thing you’ll want to do with WebDriver is navigate to a link. The normal way to do this is by calling get method: driver.get(" WebDriver will wait until the page has fully loaded (that is, the onload event has fired) before returning control to your test or script. It’s worth noting that if your page uses a lot of AJAX on load then WebDriver may not know when it has completely loaded. If you need to ensure such pages are fully loaded then you can use waits. 3.1. Interacting with the page¶ Just being able to go to places isn’t terribly useful. You could find it using any of: element = driver.find_element_by_id("passwd-id")element = driver.find_element_by_name("passwd")element = driver.find_element_by_xpath("//input[@id='passwd-id']") You can also look for a link by its text, but be careful!

WebDriver has an “Object-based” API; we represent all types of elements using the same interface. So, you’ve got an element. Element.send_keys("some text") 3.2. 3.3. 3.4. Python et OpenOffice.org - embedded weblog. Je me rends compte avec effroi que j'ai oublié d'écrire ce billet promis à un ami : c'est qu'il a rencontré des soucis de création de fichiers Excel dans une application Python devant faire du reporting. Problématique déjà rencontrée au sein de l'équipe embarqué, la solution a consisté en l'utilisation de PyUno, le binding Python-OpenOffice.org (et ça tombe bien, puisqu'on propose aussi des migrations sur la suite bureautique libre). La bonne nouvelle, c'est que l'on peut trouver des exemples et autres documentations très complètes (je ne vais donc pas m'amuser à tout reprendre) ; la mauvaise est qu'il faut savoir deux ou trois choses pour que ça marche dans la vie réelle (ou alors l'information importante est un peu perdue).

En premier lieu, il faut veiller à ce que votre environnement soit correct. Export PYTHONPATH=:/usr/lib/ooo3/basis3.0/program/ On peut à présent dans son code python faire un magnifique : import uno document.store() On peut aussi faire un : document.dispose() Aspiration des résultats de google. Mot "migrant" : variations sur le Web | Projet Encadré M1 IL. La vie multilingue des mots sur le web (projet n°1 plurital)

Ci-dessous, la chaîne de traitements à mettre en oeuvre sur une URL : Figure(s) 0 : Schéma(s) du projet On décrit ci-dessous le parcours à suivre pour mener à bien ce projet. Le code présenté infra (qui sera détaillé en cours et à mettre en oeuvre sur ses propres données) est essentiellement du bash. Le projet vise aussi à construire des scripts en Perl pour arriver à des résultats similaires. Au final, on devra donc construire 2 séries de script (une en Bash et l'autre en Perl), ces scripts devront réaliser les différentes tâches décrites au fur et à mesure du cours (voir aussi le fil de la progression ci-dessous illustré ci-dessous avec Bash).

Des exemples (solutions) de script Perl seront ajoutés au fil du projet sur cette page pour vous aider à progresser (à l'image des scripts bash déjà disponibles) . Répertoire et arborescence de travail La figure ci-dessous donne un exemple de ce que pourrait être l'arborescence des fichiers constituant le projet. Figure 1 : Arborescence de travail 3. Lexicométrie : les logiciels - Quanti IHMC.

Il n’existe pas de comparaison récente, systématique et accessible de l’ensemble des outils existants dans une perspective de sciences sociales, encore moins d’histoire. Ce qui s’en rapprocherait le plus est cette page (faite par des littéraires, qui a l’avantage de donner des liens vers les sites des logiciels. On peut aussi se référer à une présentation riche et récente d’Alain Dallo sur Hyperbase, Lexico 3, Weblex et Nooj ; à Emmanuel Bonin et Alain Dallo, « Hyperbase et Lexico 3, outils lexicométriques pour l’historien », Histoire & Mesure, XVIII-3/4, 2003, p. 289-311 ; ou, sur Prospero, Trideux, Alceste et Calliope, à Didier Demazière, Claire Brossaud, Patrick Trabal et Karl Van Meter (dir.), Analyses textuelles en sociologie.

Logiciels, méthodes, usages, Rennes, PUR, 2006. Thibaut de Saint-Pol propose ici une comparaison rapide de quelques logiciels et un approfondissement sur SPAD-T. Outils de tratement de corpus. Céline POUDATUniversité d'Orléans SOMMAIRE : 1. Outils de Traitement Automatique des Langues1.1. Outils disponibles en ligne ou téléchargeables1.1.1. Etiqueteurs1.1.2. Analyseurs syntaxiques1.2. Outils commercialisés2. Outils statistiques 1. On recense plusieurs outils disponibles en ligne, susceptibles de participer à l’analyse du corpus ; notons que la plupart de ces programmes ont été conçus en vue de valider une ou plusieurs théories linguistiques particulières. 1.1. Certains laboratoires, comme le LATL (Université de Genève), présentent un ensemble de programmes qu’il est possible de télécharger ou d’évaluer en ligne ; quelques entreprises proposent de même une démonstration de leurs outils, à des fins commerciales. 1.1.1.

A. CHUNKER (Erik Tjong Kim Sang, Dutch Language and Speech, Université d’Antwerp, Belgique) : logiciel étiquetant les SN d’un texte anglais. B. FIPSTAG® (laboratoire LATL, Université de Genève) ; étiqueteur bilingue, traitant de l’anglais et du français. 1.1.2. 2. Outils pour le TAL.