LaTeX文書からテキストだけを改行無しで取得する

LaTeX文書からテキストだけを改行無しで取得する

LaTeX文書からテキストを抜き出したい場面は結構あります.(私は主に英文校正に出す時ですが,世の中にはWord文書でしか受け付けてくれない○○なジャーナルとかあったりするので,Wordへの流し込みをするときにも必要ですね…) それを可能な限り手出しする量を減らしたい場合にどうすれば良いかのメモです.

pdftotextを使う

xpdfに付属するpdftotextを使います.Macなら,

$ port install xpdf-japanese

で一発です.

使い方ですが

$ pdftotext submit.pdf

とすれば,submit.txtにテキストが保存されます.
改ページ(^L)がいくつか残るのと,itemizeのポチが文字化けすることを除けば,テキスト自体の変換効率はとても高く,ほとんどそのまま使えます.

追記

xpdf には pdftotext が付属しなくなっていた.
替わりにxpdf派生プロジェクトのpopplerをインストールすればよい.

$ port install poppler

おわり.

カナダへの派遣

カナダへの派遣

突然ですが,水野は学内の若手教員海外派遣プログラムに採択されることになりました.
2012年3月より2013年1月までの10ヶ月間,カナダのQueen’s Universityに滞在する予定です.

研究室の皆さんとはネット経由でのミーティングなどを行います.Redmineやgitなどのシステムを導入したのはこの日のためです.なんとか乗り切って参りましょう(勝手だなあ…).

長期に他機関へ行き,別の文化の下での研究活動を行うことは私の長年の希望でした.前職の間は諸事情により叶いませんでしたが,KITの制度で派遣させてもらえることになったのは,天佑のようなものです.大変なご迷惑を掛けるにもかかわらず,気持ちよく送り出してくれる,部門の先生方に感謝します.

来年度は多方面に様々なご迷惑をおかけすると思いますが,なにとぞご容赦頂きたく存じます.