Articles of traitement de text

Impression de la ligne après ou avant une correspondance d'expression régulière dans Bash

Étant donné une string comme celle-ci: BASH – Mplayer Playlist Shuffle http://www.youtube.com/watch?v=IB7SCPtbJM8 metalx1000 BASH – Playing Music http://www.youtube.com/watch?v=S_-EGoLYCXY metalx1000 BASH – Burn ISO images with cdrecord in Linux http://www.youtube.com/watch?v=BxAEGa9NKs8 metalx1000 BASH – replace space in file names http://www.youtube.com/watch?v=MRlUPV1221Y metalx1000 Quelle serait la meilleure façon d'get les titres, les URL et les uploaders dans des variables […]

Comment convertir .doc en ODF avec une command line?

Je voudrais convertir de nombreux documents Microsoft Word en ODF (le formulaire OO.org avec une command line (car il y en a beaucoup). (J'ai besoin d'eux pour lire ensuite sur un appareil où la lecture du format OO.org est possible, mais pas le format .doc – en fait, un Android avec seulement des logiciels libres, […]

Imprimer toutes les lignes entre un model recherché d'un file text dans un file différent

J'ai un file appelé test.txt qui contient: ….Request…. asaksa sda dsad dsad ….Request… 21mklk nnm212 mkmr543 849238 ….Request… 4392840 kndska 94i0-jkfjdk smdla …..Request.. 839281 ksndlka nsc mcxmzl Je veux que toutes les lignes entre deux "Demande" motif devrait imprimer à différent -2 file comme: file1: asaksa sda dsad dsad file2: 21mklk nnm212 mkmr543 849238 file3: […]

Gestion dynamic des positions des colonnes et fractionnement du file

J'ai un problème unique. J'ai un file avec les colonnes suivantes PersonId, AB1, AB2, AB3, DG1_B1,DG1_B2,DG2 1,0,1,0,3,5,7 2,0,3,1,3,7,4 Je veux split ceci et créer plusieurs files basés sur le préfixe de colonne. Je veux que la sortie soit comme suit File_AB1.csv PersonId, AB1, AB2, AB3 1,0,1,0 2,0,3,1 File_DG1.csv PersonId, DG1_B1,DG1_B2 1,3,5 2,3,7 File_DG2.csv PersonId, DG2 […]

Que signifie "position" dans le message d'erreur iconv?

J'obtiens une erreur lors de la conversion d'un file volumineux: $ iconv -f GB2312 -t UTF-8 2001.txt -o 2001_u.txt iconv: illegal input sequence at position 245256667 Que signifie la position dans cette erreur? J'ai essayé ce n'est pas le numéro de ligne. Comment accéder à la position dans d'autres outils ou éditeurs comme emacs?

Comment utiliser awk pour créer un index de mots dans le file?

J'ai un problème avec mes devoirs J'ai besoin de créer un script shell en utilisant awk . Le script affichera uniquement les mots du file dans un ordre alphabétique, et après le mot : après cela un espace puis une list séparée par des virgules des lignes sur lesquelles le mot apparaît. Par exemple: C […]

Calculer et arrondir les nombres dans bash

Je me bats avec une légère variation sur: Comment calculer en prenant le premier champ et Comment arrondir les nombres à floating point dans la coquille? J'ai un file qui ressemble à (espace entre les colonnes): 1533 C_P.doc 691 C_M.doc 905 G_S.doc 945 J_Z.doc 1549 J_M.doc 1701 L_B.doc Je veux prendre la colonne des nombres […]

Bash scripting pour parsingr les files pour les mots et créer un rapport

Ok oui c'est une tâche à faire mais MAIS je ne cherche pas à avoir les réponses qui me sont données. Le scénario est que j'ai besoin d'un script qui search tous les directorys personnels de mes users pour les mots incorrects. J'ai besoin du script pour signaler à l'écran certaines informations comme nom d'user […]

Extraire le premier mot après le motif qui inclut “

J'ai un problème quand j'essaie d'extraire le premier mot après grep correspond à mon model. Laissez-moi vous montrer un exemple: cat test.txt [profile dev] xxx xxx [profile prod] xxx xxx maintenant je veux extraire le mot après «profil» et éventuellement l'affecter dans une variable J'ai essayé avec grep et awk mais il semble que je […]

Compter le nombre d'inputs dans la colonne 2 où la colonne 1 est similaire

J'essaie de countr le nombre d'inputs dans la colonne 2 pour la même colonne1 et aussi le nombre de fois où la première input dans la colonne2 se produit pour la colonne1 similaire. Par exemple mon file TSV d'input est: C1 NC01 NC01 C2 NC01 NC01 NC02 C3 NC01 NC02 NC03 Et mon résultat désiré […]