samedi 27 octobre 2012
Exercices Phase 1 UNIX
Voilà (enfin!!!) les exercices de la phase1 du cours qui consistent principalement à utiliser les commandes UNIX apprises en cours :
Exercice1
exercice 2 et 3 :
par Elsa, Adrien et Sofiane
mardi 23 octobre 2012
EXERCICES POUR LE 24 OCTOBRE 2012
Voici nos propositions de réponses aux exercices :
Exercice 1 : écriture d'un script pour la création de l'environnement de travail :
environnement.sh----------------------
#!/bin/bash
#ce script doit se trouver dans le répertoire utilisateur
#dans le terminal, on doit se placer dans le dossier "Desktop" du dossier utilisateur avant la création de l'espace de travail
cd Desktop;
#on crée ensuite un nouveau dossier pour le projet puis on se place dans ce nouveau dossier où on crée les sous-dossiers dont on aura besoin
mkdir PROJET-MOT-SUR-LE-WEB;
cd PROJET-MOT-SUR-LE-WEB;
mkdir CONTEXTES DUMP-TEXT IMAGES minigrepmultilingue-html PAGES-ASPIREES PROGRAMMES TABLEAUX URLS;
----------------------------------------------
Inconvénient : Pour que ce script fonctionne, il faut qu'il y ait bien un dossier appelé "Desktop" dans le dossier utilisateur !
Exercice 2 : construire une page HTML contenant nos noms dans le titre de la page et un tableau de 2 lignes avec sur la première : nos noms, sur la seconde : le titre de notre projet.
Voici une proposition de script :
web.sh---------------------------
#!/bin/bash
touch pageweb.html;
echo "<html><head><meta http-equiv="content-type" content="text/html\; charset=UTF-8" /><title>Adrien, Elsa & Sofiane</title></head><body><table width="40%" border="1"><tr><td>Adrien, Elsa et Sofiane</td></tr><tr><td>La guerre médiatique de Kadhafi</td></tr></table></body></html>" > pageweb.html;
-------------------------------------
exercice3a.sh-----------------------------
#!/bin/bash
cd ../DUMP-TEXT;
touch fichier.txt;
echo "Adrien, Elsa & Sofiane
La guerre médiatique de Kadhafi" > fichier.txt;
----------------------------------------------
Ca marche, c'est magique :) !
exercice3b.sh---------------------------
#!/bin/bash
cd ../TABLEAUX
touch tableau.html;
echo "<html><head><meta http-equiv="content-type" content="text/html\; charset=UTF-8" /><title>Adrien, Elsa & Sofiane</title></head><body><table width="40%" border="1"><tr><td>Adrien, Elsa et Sofiane</td></tr><tr><td>La guerre médiatique de Kadhafi</td></tr></table></body></html>" > tableau.html;
-------------------------------------------
Encore plus fort !!!!
Voici nos propositions de réponses aux exercices :
Exercice 1 : écriture d'un script pour la création de l'environnement de travail :
environnement.sh----------------------
#!/bin/bash
#ce script doit se trouver dans le répertoire utilisateur
#dans le terminal, on doit se placer dans le dossier "Desktop" du dossier utilisateur avant la création de l'espace de travail
cd Desktop;
#on crée ensuite un nouveau dossier pour le projet puis on se place dans ce nouveau dossier où on crée les sous-dossiers dont on aura besoin
mkdir PROJET-MOT-SUR-LE-WEB;
cd PROJET-MOT-SUR-LE-WEB;
mkdir CONTEXTES DUMP-TEXT IMAGES minigrepmultilingue-html PAGES-ASPIREES PROGRAMMES TABLEAUX URLS;
----------------------------------------------
Inconvénient : Pour que ce script fonctionne, il faut qu'il y ait bien un dossier appelé "Desktop" dans le dossier utilisateur !
Exercice 2 : construire une page HTML contenant nos noms dans le titre de la page et un tableau de 2 lignes avec sur la première : nos noms, sur la seconde : le titre de notre projet.
Voici une proposition de script :
web.sh---------------------------
#!/bin/bash
touch pageweb.html;
echo "<html><head><meta http-equiv="content-type" content="text/html\; charset=UTF-8" /><title>Adrien, Elsa & Sofiane</title></head><body><table width="40%" border="1"><tr><td>Adrien, Elsa et Sofiane</td></tr><tr><td>La guerre médiatique de Kadhafi</td></tr></table></body></html>" > pageweb.html;
-------------------------------------
Attention: pour pouvoir insérer le caractère ";" dans le code html avant "charset=UTF-8", on a dû utiliser le caractère "\" devant pour signaler que bash ne doit pas interpréter ce signe comme une fin de commande !
Exercice3a : Ecrire un script (dans le dossier PROGRAMMES) permettant de générer dans le répertoire
DUMP‐TEXT un fichier txt contenant 2 lignes (sur la première, votre nom, sur la seconde, le
mot choisi pour votre projet)
exercice3a.sh-----------------------------
#!/bin/bash
cd ../DUMP-TEXT;
touch fichier.txt;
echo "Adrien, Elsa & Sofiane
La guerre médiatique de Kadhafi" > fichier.txt;
----------------------------------------------
Ca marche, c'est magique :) !
Exercice3b: Ecrire un script (dans le dossier PROGRAMMES) permettant de générer dans le répertoire
TABLEAUX un fichier html contenant 1 tableaux avec 2 lignes (sur la première, votre nom, sur
la seconde, le mot choisi pour votre projet)
exercice3b.sh---------------------------
#!/bin/bash
cd ../TABLEAUX
touch tableau.html;
echo "<html><head><meta http-equiv="content-type" content="text/html\; charset=UTF-8" /><title>Adrien, Elsa & Sofiane</title></head><body><table width="40%" border="1"><tr><td>Adrien, Elsa et Sofiane</td></tr><tr><td>La guerre médiatique de Kadhafi</td></tr></table></body></html>" > tableau.html;
-------------------------------------------
Encore plus fort !!!!
COMMENT NOUS AVONS CHOISI NOS URLS ?
Libération
Le Monde
Le Parisien
La Tribune
Les Echos
Le Figaro
L'Humanité
La Croix
France Soir
Metro
20 minutes
Adrien : Je me suis intéressé uniquement aux articles de presse disponibles en ligne sur les sites internet des principaux journaux français et plus particulièrement ceux concernant les quotidiens nationaux, à savoir :
J'ai aussi fait des recherches du côté de quelques périodiques comme ceux du Nouvel Observateur, Le Point ou L'Express, mais je n'ai pas plus approfondi cette piste pour l'instant comme je dispose déjà d'un nombre assez important d'URLs.
Le principale problème que je rencontre est que des sites de presses différents présentent parfois des articles identiques ou presque dont la source principale est l'Agence France Presse (AFP). Comme je ne m'en suis pas rendu compte tout de suite, il faudra que je prévois de faire un tri afin d'éviter d'avoir trop de redondance dans le choix des textes !
Elsa : Pour ma recherche d'Urls, j'ai fait, pour le moment, une simple recherche google "kadhafi's death" et j'ai sélectionné des articles de presse de journaux britanniques ou bien américains, voir canadiens, parmi les résultats de la recherche. J'en suis à une trentaine d'URLs. Je tenterai pour mes prochains Urls une autre approche que je vous présenterai une fois appliquée :)
Sofiane : (à completer)
A LA RECHERCHE DES URLS...
Pour constituer notre corpus de texte, nous avons choisi de restreindre notre recherche à la presse anglo-saxonne, maghrébine et française.
Elsa, l'algophone la plus chevronnée d'entre nous, s'occupera de relever une cinquantaine d'URLs en anglais, Sofiane partira à la recherche d'URL en arabe et Adrien dépouillera le reste du web francophone.
On devrait donc bientôt se retrouver avec plus de 150 URLs à traiter : notre premier corpus multilingue !!!
lundi 15 octobre 2012
Et le premier jour, "les bras cassés" créèrent le Blog ! (référence
biblique hautement linguistique pour qui connaît l'histoire du verbe)
QUI SONT LES BRAS CASSES ?
Notre équipe est donc composée de :
- Adrien dit "l'homme qui parlait le breton", ancien étudiant de breton, mais aussi de linguistique à Paris 5 (Master validé!), parti de Lyon
puis de Rennes pour arriver dans la capitale. Il parle le français, le
breton !! et l'anglais as everybody of course...
- Sofiane dit "le berbère de Tizi", ancien étudiant de langue et littérature française à Tizi-Ouzou (Algérie) tout juste débarqué de
l'avion dans les bras de Paris. Il parle le français, l'arabe, l'anglais et le
kabyle bien sûr !
- The last but not the least of course !! Elsa dite "ben la fille quoi",
ancienne étudiante en beaucoup de choses, mais gardons le meilleur :
détentrice d'un Master 1 en Linguistique Théorique et Descriptive de
Paris 7. Elle parle français et anglais (oui il y a là un manque totale
d'originalité...).
POURQUOI CE BLOG ?
Dans le cadre du cours "Programmation et Projet Encadré" du master Ingénierie Linguistique nous avons choisi de mettre en pratique nos acquisitions en programmation autour d'une thématique d'actualité : la mort de Kadhafi vu par les médias maghrébins, français et anglo-saxons.
Dans un premier temps, nous recueillerons une cinquantaine d'URLs issues de sites de presse en anglais, français et arabe. C'est à partir de ce corpus que nous essayerons à l'aide de la programmation de mettre en évidence les différences de point de vue sur la mort de Kadhafi en fonction de ces pays.
Nous présenterons dans ce blog, les travaux que nous réaliserons au fur et à mesure de notre apprentissage !
Inscription à :
Articles (Atom)