Articles of unicode

Caractères unicode manquants

Je viens juste de passer de KDE à un environnement léger et mince xmonad et mes fonts ne sont pas rendues correctement. J'utilise la famille de fonts DejaVu (par défaut pour Debian 7.x) qui supporte tous les caractères dont j'ai besoin (Preuve: J'ai cherché ces caractères dans gucharmap + dans l'application "konsole" J'utilise rxvt-unicode comme […]

Typographie de la page de manuel et tirets appropriés

Les pages de manuel doivent-elles éviter d'utiliser des caractères unicode comme le m-dash (-)? J'ai remarqué que la plupart des pages de manuel utilisent des tirets / tirets dans leurs slogans où, je crois, un tiret aurait été plus correct typographiquement. Le man-page de la coquille de tableau de bord est à la hauteur de […]

MySQL 5.1 à 5.5: tous les caractères UTF-8 sont perdus!

J'ai décidé de mettre à niveau mon installation Debian, et après quelques jours en utilisant MySQL 5.5, j'ai trouvé que mysql imprime des ordures au terminal au lieu des caractères UTF-8. J'ai jeté un oeil au file SQL qui a été produit par mysqldump , et j'ai remarqué qu'il contenait déjà les ordures. Aujourd'hui, j'ai […]

Comment créer un file text (1 gigaoctet) contenant des caractères randoms avec un enencoding UTF-8?

La command suivante n'utilise pas UTF-8: head -c 1M </dev/urandom >myfile.txt

Grep ne correspond pas aux caractères non-ascii

J'ai trouvé une séquence problématique d'un prétendu file text encodé en UTF-8. La chose étrange est que grep semble incapable de faire correspondre cette ligne non-ASCII. $ iconv -f utf8 -t iso88591 corrupt_part.txt –output corrupt_part.txt.conv iconv: illegal input sequence at position 8 $ cat corrupt_part.txt Oberallg u $ grep -P -n '[^\x00-\x7F]' corrupt_part.txt $ od […]

Le calmar ne bloque pas les domans non-ascii

J'ai les lignes suivantes dans /etc/squid/squid.conf : acl bad_url url_regex "/etc/squid/block.acl" http_access deny bad_url Toutes les URL de block.acl doivent être bloquées par le server proxy. Cela fonctionne pour tous les domaines ASCII, mais quand j'ajoute un domaine non ascii tel que helfende-hände.de à /etc/squid/block.acl , le domaine n'est pas bloqué. Comment puis-je réparer ça?

Les browsers Web basés sur du text prennent-ils en charge les caractères de dessin de boîte unicode?

J'ai un peu de HTML comme ceci: &#x250c&#x2500&#x2500&#x2500&#x2500&#x2500&#x2500&#x2500&#x2500 &#x2500&#x2500&#x2500&#x2500&#x2500&#x2500&#x2500&#x2500&#x2510<br> &#x2502testtesttesttest&#x2502<br> &#x2514&#x2500&#x2500&#x2500&#x2500&#x2500&#x2500&#x2500&#x2500 &#x2500&#x2500&#x2500&#x2500&#x2500&#x2500&#x2500&#x2500&#x2518<br> Il apparaît dans Chrome avec une boîte solide comme je m'y attendais (ne peut pas l'afficher dans SE non plus!): ┌────────────────┐ │testtesttesttest│ └────────────────┘ et j'espérais que les browsers de text pourraient le faire aussi, mais sur Lynx je reçois + —————- + | […]

Pourquoi est-il impossible de searchr dans le contenu du file text codé en UTF-16?

Je comprends que, par exemple, catfish et gnome-search-util peuvent tous les deux searchr dans le contenu du file encodé en UTF-8. Pour pouvoir searchr des mots ou des nombres dans des files text, il faudrait d'abord les convertir via iconv en UTF-8. Si le file est connu, les éditeurs de text comme gedit ou mousepad […]

tr ne remplace pas apostrophe

Je veux convertir toutes les apostrophes dans ce file en X : Bob's book Bob's book Bob′s book # (Might look the same but actually different) La première apostrophe est remplacée comme prévu: $ cat file | tr "'" "X" BobXs book Bob's book Bob′s book Mais les deux autres sortes d'apostrophe, des choses étranges […]

cp: quels guillemets sont utilisés dans les messages d'erreur?

Je suis actuellement sortingpotant avec un disque dur mourant, et en essayant de cp données de lui, j'obtiens des erreurs comme cp: error reading 'brokenFile': Input/output error # comparison: backtick: `, apostrophe ' J'essaie maintenant de copyr à nouveau les files défectueux en utilisant sed pour convertir les messages d'erreur en nouvelles invocations cp (j'ai […]