Articles of encoding de caractères

Que signifie "position" dans le message d'erreur iconv?

J'obtiens une erreur lors de la conversion d'un file volumineux: $ iconv -f GB2312 -t UTF-8 2001.txt -o 2001_u.txt iconv: illegal input sequence at position 245256667 Que signifie la position dans cette erreur? J'ai essayé ce n'est pas le numéro de ligne. Comment accéder à la position dans d'autres outils ou éditeurs comme emacs?

Comment puis-je get des caractères japonais pour montrer correctement dans Firefox sur Arch?

J'exécute Firefox 52.0.2 sur Arch Linux et même si sur le système (par exemple: dans Nautilus) j'ai des caractères japonais qui montrent bien, dans Firefox ils sont illisibles car tout ce qui leur est montré est la suivante: Ce sera parce que je n'ai pas la police installée qui permet l'affichage de Hiragina, Katakana et […]

tr ne remplace pas apostrophe

Je veux convertir toutes les apostrophes dans ce file en X : Bob's book Bob's book Bob′s book # (Might look the same but actually different) La première apostrophe est remplacée comme prévu: $ cat file | tr "'" "X" BobXs book Bob's book Bob′s book Mais les deux autres sortes d'apostrophe, des choses étranges […]

cp: quels guillemets sont utilisés dans les messages d'erreur?

Je suis actuellement sortingpotant avec un disque dur mourant, et en essayant de cp données de lui, j'obtiens des erreurs comme cp: error reading 'brokenFile': Input/output error # comparison: backtick: `, apostrophe ' J'essaie maintenant de copyr à nouveau les files défectueux en utilisant sed pour convertir les messages d'erreur en nouvelles invocations cp (j'ai […]

Codage d'un file zip

Quand j'extrais un file (mp3) avec des caractères japonais ou coréens dans son nom de file sur Windows, ils apparaissent normalement, mais quand je l'extrait sur Linux (Ubuntu / Mint), ils apparaissent comme quelque chose comme ça 5thƒAƒ‹ƒoƒ€w1“x “¡“c–ƒˆßŽq 03 '²‹Æ ????? La question est: Comment réparer ces files déjà extraits? Comment réparer les tags […]

Les caractères UTF-8 ne s'affichent pas correctement dans Debian

Brève description de mon problème: Je suis tombé sur un problème dernièrement où je ne peux pas faire de bash / nano / irssi / etc afficher des caractères "spéciaux" UTF-8 comme les trémas allemands (äüö), le signe euro (€) et d'autres caractères UTF-8 comme ß , §, etc. Ce que j'ai déjà essayé: dpkg-reconfigure […]

Que casserait si la locale C était UTF-8 au lieu de ASCII?

La locale C est définie pour utiliser le jeu de caractères ASCII et POSIX ne permet pas d'utiliser un jeu de caractères sans modifier les parameters régionaux. Que se passerait-il si le encoding de C était remplacé par UTF-8? Le côté positif serait que UTF-8 devienne le jeu de caractères par défaut pour n'importe quel […]

Définissez le charset par défaut du terminal Gnome sur utf8

Actuellement, j'ai ouvert mon terminal gnome et le jeu de caractères par défaut est gb2312. Comment définir le charset par défaut sur utf8 dans le terminal Gnome? J'ai vérifié le paramètre de preference mais ne semblait pas le find. Merci pour toute aide!

Effet de $ LANG sur le terminal

J'essaie d' apprendre comment la variable $LANG se comporte avec gnome-terminal (et son option de preference d'enencoding de caractères). J'ai utilisé iso8859-1 (latin1) comme mon jeu de caractères principal et tous mes noms de files sont encodés comme tels. Pour les tests suivants, je vais faire un ls -l d'un directory avec des caractères accentués […]

Pourquoi wc -m et wc -c sont-ils différents?

En tant que programmeur C, j'ai été surpris de voir que wc -c (qui count le nombre d'octets) et wc -m (qui count le nombre de caractères) produisent des résultats très différents pour un long file text. On m'avait toujours dit que sizeof(char) est 1 octet. qdii@nomada ~/Documents $ wc -c sentences.csv 102990983 sentences.csv qdii@nomada […]