Текст
PDF Печать E-mail

Программа распознавания текста Cuneiform


Для распознавания текста в linux есть неплохая альтернатива Finereader — консольная утилита Cuneiform. Я ставил ее на debian, в репозитариях ее не было, поэтому пришлось качать исходники с https://launchpad.net/cuneiform-linux/ (там есть именно под debian, как, впрочем, и под другие дистрибутивы linux). Ставим пакеты, которые понадобятся для установки (если еще не установлены):

apt-get install imagemagick libmagick-dev cmake build-essential

Качаем исходники:

wget https://launchpad.net/debian/+archive/primary/+files/cuneiform_1.1.0%2Bdfsg.orig.tar.bz2

 
PDF Печать E-mail

Скрипт рекурсивного переименования файлов и каталогов текущего каталога в латиницу (транслит)


Иногда возникает необходимость массово переименовать файлы и каталоги в латиницу. Когда-то на просторах интернета (где уже не помню) нашел скрипт, решающий эту задачу. Ниже представлен его слегка модифицированный вариант с комментариями.

Создаем скрипт:


 
PDF Печать E-mail

Просмотр конфигурационных файлов без комментариев и пустых строк


Это возможно с помощью такой команды:

cat squid.conf | grep -v '^#' | sed '/^$/d' | more

Разберем команду подробнее.


 
PDF Печать E-mail

Четыре способа просмотреть pdf в консоли

 

Способ первый.

 

Если нужен только текст из файла и файл небольшой (не нужно запоминать где закончили читать) - то вообще не проблема:

 

less xxx.pdf

 

 
PDF Печать E-mail

Читаем документы формата .doc в консоли (antiword)

 

Иногда возникает необходимость просмотреть какой либо файл в формате .doc в консоли. Для  этих целей можно использовать программу под названием  antiword.

 

Antiword - свободная программа для чтения документов MS-Word под Linux, RISC OS и DOS. Конвертирует документы Word версий 2, 6, 7, 97, 2000, 2002 и 2003 в простой текст, форматы Postscript и XML/DocBook. При этом Antiword пытается максимально сохранить оформление документа.

 
Страница 1 из 2