Articles of traitement de text

Trouver du text entre l'onglet (\ t) comme délimiteur

Je pensais que ce serait simple, mais je ne peux pas find comment le faire. Scénario J'ai un seul file .csv avec id_user , text , colonnes id_group où chaque colonne est délimitée par des tabs tels que: "123456789" "Here's the field of the text, also contains comma" "10" "987456321" "Here's the field of the […]

Modifier le file existant directement pour replace "foo" par "bar" UNIQUEMENT pour les lignes qui contiennent "baz"

J'ai un file food.txt comme suit: – mangoes|foo|faa oranges|foo|faa chocolates|foo|baz J'essaye de replace foo avec la barre si la condition baz est satisfaite. (voudrait utiliser une expression régulière ici b * z) En cours d'utilisation de la command sed ci-dessous, mais cela ne modifie pas directement le file existant. Je ne peux pas non plus […]

Analyser plusieurs sections de données dans des files séparés

J'ai un file journal concaténé avec plusieurs journaux à l'intérieur que j'essaie d'parsingr dans des files journaux individuels (je les renommerai plus tard à la date / l'heure de chaque). Chaque journal est séparé par "— LOG REPORT —". Jusqu'à présent, j'ai … sed -n '/— LOG REPORT —/,/— LOG REPORT —/p' logname.log > test.out […]

Club set N ligne consécutive en coquillage?

Disons que j'ai un file text dans ce format field1a field2a field3a field1b field2b field3b Je veux club 3 (ou en général N) lignes consécutives, comment vais-je le faire avec sed ou autre utilitaire de command line dans shell bash? production attendue field1a:field2a:field3a field1b:field2b:field3b

Comment extraire du text en utilisant sed

J'ai un file text et je veux extraire seulement le text commençant et se terminant par certaines strings en utilisant sed . Par exemple, dans la ligne: ssortingng>![TEST[Extract this ssortingng]>/ssortingng> Je veux get Extract this ssortingng Comment metsortingez-vous cela en application avec sed ? Fondamentalement, je veux get du text qui commence par l'expression " […]

Incrémenter l'index dans le file

D'accord, il semble que je n'arrive pas à find un moyen de faire ce dont j'ai besoin. Disons que j'ai un file text A comme ça (freqBiasL2[27]) (SatBiasL1[27]) (defSatBiasL2_L1[27]) (defSatBiasSlope[27]) (defSatBiasSigma[27]) (freqBiasL2[28]) (SatBiasL1[28]) (defSatBiasL2_L1[28]) (defSatBiasSlope[28]) (defSatBiasSigma[28]) (freqBiasL2[29]) (SatBiasL1[29]) (defSatBiasL2_L1[29]) (defSatBiasSlope[29]) (defSatBiasSigma[29]) etc. Je veux changer l'index entre [] entre parenthèses de sorte que chaque index […]

Trouver un personnage dans une colonne

J'ai une chaine separee (|), j'ai besoin de find le premier chracter dans la 7eme colonne de cette chaine separee AAAAAA|04|XXXXXXX|20170210-163119|||2.0|20170208|| Sortie attendue: 2

awk + comment capturer l'adresse email entre les personnages

J'ai une très longue list d'e-mails entre les caractères < et > : smeimebv2t <jdyefc@nsuwtcvc>; jdedyvt <ejd2ydt2@dv2dg2vgv>; didi2jd2m <i2dmi32@hd2vdg >; 3idm23i2m <2udhu2@cdrrc> . . . Comment puis-je utiliser un seul liner awk ou perl pour ne capturer que les adresses e-mail entre le < > ? Exemple: more results.out jdyefc@nsuwtcvc ejd2ydt2@dv2dg2vgv i2dmi32@hd2vdg 2udhu2@cdrrc

Ajouter des guillemets et un nouveau délimiteur autour des mots délimités par l'espace

J'ai la string suivante y10_zcis y10_nom y10_infl y20_zcis y20_infl y30_zcis Je voudrais transformer cela en "y10_zcis", "y10_nom", "y10_infl", "y20_zcis", "y20_infl", "y30_zcis" J'ai accompli quelque chose de semblable avec le très laid: $ cat in.txt | sed 's/ /\'$'\n/g' | sed 's/\(.*\)/"\1",/g' | tr -d '\n' "y10_zcis","y10_nom","y10_infl","y20_zcis","y20_infl","y30_zcis", Mais cela ressemble à un échec total, et il […]

Comment get des lignes uniques en fonction de la valeur d'une colonne

Entrée suivante: A 13 A 12 B 17 C 33 D 344 C 24 A 5 C 99 Je veux get seulement les lignes où la première colonne est unique: B 17 D 344 Une solution avec awk serait bien, mais quelque chose d'autre est également acceptable.