rptパッケージの詳細について

T. Yoshiizumi

2017/03/04


<目 次>


 rptというフォルダの下には、ruby, pandoc, 統計ソフトR, LaTeX(w32tex) といったフリーウェアが入っています。

MS-Windowsで動作する実行ファイルその他一式です。

I. rptの下にあるフォルダとファイルについて

 以下、関連のフォルダとファイルについて記します。

1. bat または bat64 (フォルダ)

 このフォルダには下で紹介するバッチコマンドがあります。

 64bit用のコマンドを動かしたい場合は bat64 の下のバッチを実行します。

 32bit用なら bat の下にあるバッチを実行します。

(1) rpt_set.bat

 これを実行すると、「送る」メニューに関連のメニュー項目が登録されます。

 登録される「送る」メニューは次のものです。

  (a) 「r rubyの実行」
  (b) 「t textへの変換」
  (c) 「s 送るメニューに登録」

 rptパッケージに入っているコマンドは、いずれも基本的に
コマンドプロンプト(DOS窓)で起動させるコマンドですが、
「送る」メニューを使うことでWindowsライクなコマンド実行ができます。

 たとえば、マイコンピュータでrubyプログラムファイルに焦点を当てて
「送る」メニューの「r rubyの実行」を選びます。

 そうすると、そのプログラムが実行されます。

 標準出力と標準エラー出力は、それぞれ x_out.txt, x_error.txt に書き出されます。

 また、Excel, Word, パワーポイント, 一太郎などのファイルに焦点を当てて、 「送る」メニューから「t textへの変換」を選ぶと、 変換結果が test.xlsx.txt とか test.docx.txt などとして書き出されます。

    

(2) rpt_unset.bat

 これを実行すると、「送る」メニューの関連項目が消去されます。

 ハードディスク上に設けられたpandoc用reference.docxも削除されます。

    

(3) rpt_cmd.bat

 これを実行すると、MS-Windowsのコマンドライン(DOS窓)の状態になります。

 ruby, pandoc, 統計ソフトR, LaTeX(w32tex), xdoc2txtの実行ファイルは、 フルパス名でなく、単に ruby.exe とか pandoc.exe と入力すれば実行できます。

 それら実行ファイルがあるディレクトリにパスが通った状態で、DOS窓が開きます。

 DOS窓を閉じる時は、通常どおり exit [enter] を入力して下さい。

 なお、この rpt_cmd.bat というバッチコマンドは、
前述の rpt_set.bat の実行の有無に関係なく使うことができます。

*注: bat, bat64 というフォルダの下にはrmdファイルを処理するためのバッチもあります。それについては rptパッケージとrmarkdown を参照して下さい。


2. d2txt (フォルダ)

 このフォルダの中には、Excel, Word, 一太郎, パワーポイント, pdf など
様々なファイルをテキストファイルに変換するためのツールがあります。
主役は xdoc2txt.exe です。

 test.doc というファイルに焦点を当てて、「送る」メニューの「t textへの変換」を選ぶと、test.doc.txt が作られます。

 OCR機能はないので、画像化された文字を変換することはできませんが、変換処理が迅速で便利です。

 xdoc2txtのサイトは次のところです。

xdoc2txt


3. pandoc (フォルダ)

 このフォルダの中には、markdownをhtmlやWordのファイルに変換する pandoc.exe が入っています。

 pandocには、Wordファイルだけでなく多様なファイルに変換する機能がありますが、サンプルプログラムでは主にWordファイルへの変換を取り上げています。

参考サイト:  Pandoc ユーザーズガイド 日本語版


4. w32tex (フォルダ)

 このフォルダの中には、LaTeX(w32tex)関連のコマンドやフォントなど様々なファイルが入っています。

 ダウンロードしたサイトは、次のミラーサイトです。

Index of /mirror/w32tex/current

 詳細は rptパッケージで導入したw32texについてを参照して下さい。


5. R (フォルダ)

 このフォルダの中には、統計解析ソフトRに関連するファイルが一式入っています。

 付属のサンプルプログラムの多くでは、Rを直接実行するのではなく、 rubyを通して実行するようにしています。

 統計分析結果を markdown, html などとして取りまとめるための ライブラリ knitr, rmarkdown が組み込み済みです。


6. ruby または ruby64 (フォルダ)

 このフォルダの中には、プログラム処理系のrubyが入っています。

 ruby用のプログラム test.rb あるいは test.rb.txt に焦点を当てて、
「送る」メニューの「r rubyの実行」を選ぶと、そのプログラムが実行されます。

 rpt付属のサンプルに限らず、いろいろな形で ruby を活用できるので、 興味のある方は是非お試し下さい。


7. devkit または divkit64 (フォルダ)

 プログラム処理系 ruby の DEVELOPMENT KIT。

 rubyのライブラリによっては、この DEVELOPMENT KIT が必要になるものがあります。

 このフォルダの下にあるファイルをユーザーが直接利用することはないと思います。


8. with (フォルダ)

 このフォルダの下にあるファイルは、削除したり変更したりしないで下さい。

 次のファイルがあります。

    

 以上のファイルのうち、拡張子 .rb のrubyスクリプトは、
「送る」メニューに登録して使うことができます。

 たとえば、「w ワード文書の作成・確認.rb」に焦点を当てて、
「送る」メニューを開いて「s 送るメニューに登録」を選ぶと、
「w ワード文書の作成・確認」が「送る」メニューに登録されます。

 こうしておけば、markdown で書かれた原稿ファイルに焦点を当てて、
「送る」メニューから「w ワード文書の作成・確認」を呼び出すと、
markdownファイルからワード文書が生成されることになります。

    

 以上が当フォルダに入っているファイルとフォルダの概要です。


II. 「送る」メニューに新たに登録される項目について

 rpt_set.batを実行した時に、「送る」メニューに新たに登録される項目について簡単に記します。

(1) r rubyの実行

 rubyプログラムのファイルに焦点を当てた状態でこれを選択すると、該当のプログラムが実行されます。

 標準出力は X_OUT.TXT、標準エラー出力は X_ERROR.TXT に書き出されます。

 ただし、rubyプログラムの一行目にコメントとして
(no >) の6文字が含まれていると、
この X_OUT.TXT, X_ERROR.TXT への書き出しは行われません。

    

(2) t textへの変換

 xdoc2txtを用いて、Excel, Word, PowerPoint, 一太郎などのファイルをテキストファイルに変換します。

 test.xlsに焦点を当てた状態で、「送る」メニューから「t textへの変換」を選ぶと、test.xls.txt というテキストファイルが生成されます。

 マイコンピュータ(explorer)で複数のファイルにマークを付けて、この「t textへの変換」を選ぶと、マークした複数のファイルがそれぞれ変換されます。

    

(3) s 送るメニューに登録

 自作のrubyプログラムやバッチコマンドを「送る」メニューに登録したい場合、
該当のプログラムファイルに焦点を当てた状態でこれを選択します。

 例えば、markdownの原稿ファイルをhtmlに変換する機会が多ければ、
その変換を行うrubyプログラムを作って、送る」メニューに登録します。

 rubyプログラムの名前が「markdown→html.rb」である場合、
これを「送る」メニューに登録すると、「markdown→html」というメニュー項目が新たに登録されます。

 そうしておけば、markdownの原稿ファイルに焦点を当てた状態で
「送る」メニューの「markdown→html」を選ぶことによって、 markdownからhtmlへの変換を行えるようになります。

 一方、「送る」メニューから「markdown→html」を削除したい時は、
「markdown→html.rb」というrubyプログラムファイルに焦点を当てた状態で、
「送る」メニューの「s 送るメニューに登録」を選びます。

すると、同じ名前のものが既にあるけれども削除するかどうか、といったことを尋ねてきますので、「はい」 「いいえ」で答えて下さい。


III. 注意点

 以下では、注意点をいくつか記します。

1. 複数のファイルを「送る」メニューの「r rubyの実行」に渡した場合

 マイコンピュータ(explorer)で複数のファイルをマークしてから
「送る」メニューの「r rubyの実行」を呼び出すと、
指定された複数のファイルを一度に ruby.exe の引数として渡します。

引数がどんな順番で渡されるかは不定ですが、
引数の中に test.rb とか test.rb.txt のように、
ファイル名の末尾が「.rb」か「.rb.txt」のものがあると、
それを第1引数にします。

つまり、ruby用のプログラムとみなして先に持ってきます。

 どのコマンドについてもいえることですが、マークしたファイルの数が多いと、 うまく処理されないことがあるかもしれません。


2. 環境変数 PATH の値

 rptパッケージに関連するコマンドが実行されている間、
環境変数 PATH の値が一時的に変更されます。

 従来の値に、ruby.exe, rcmd.exe, pandoc.exe などがあるフォルダが追加されます。

コマンドの実行が終了すると、PATHの値は元に戻ります。

 rpt_cmd.batを実行した時も、PATHの値の挙動は同じです。


3. rptパッケージの置き場所

 rptパッケージは、どのドライブに置いてもかまいません。

ハードディスク、USBメモリー、SDカードなどでも大丈夫です。

 USBメモリーやSDカードに入れて持ち歩けば、
常用パソコン以外でも簡単に使い始めることができます。

rpt_set.batを実行すれば、rptパッケージを使えるようになります。

 その際、「送る」メニューの関連項目は、
パソコンのCドライブ(ハードディスク)に書き出されます。

また、必要なバッチファイルが、HOMEディレクトリの下に「$$rpt」というフォルダを設けて、その中に書き出されます。これもCドライブ(ハードディスク)です。

 そうしたrptパッケージの痕跡を消去するには rpt_unset.bat を実行します。


4. pandocのreference.docxについて

 rpt_set.batを実行すると、pandoc用のreference.docxがハードディスクに設けられます。

 pandocのユーザデータディレクトリが既に存在するのであれば、その中に設けられます。

ただし、既に reference.docx がその中にあれば、新たに設けることはしません。

 pandocのユーザデータディレクトリが存在しなければ、新たにそのディレクトリを設けた上で、その中に reference.docx を置きます。

 pandocのユーザデータディレクトリは、Windows7の場合でいうと 「C:\Users\USERNAME\AppData\Roaming\pandoc」のようなディレクトリです。

 rpt_unset.batを実行すると、pandocのユーザデータディレクトリも reference.docx も削除されます。

ただし、それらが rpt_set.bat によって新たに設けられたものでない場合、
つまり、以前から存在していた場合は、削除されません。


5. xdoc2txt.exeのオプション指定

 Excel, Word, pdfなどからテキストを抽出するためのコマンド xdoc2txt.exe は、 いろいろなオプションを指定できます。

 その解説は、\rpt\d2txt\command\xdoc2txt.txt に詳述されています。

 「送る」メニューの「t textへの変換」を呼び出した時は、
-r=0 (html文書のルビ削除)というオプションのみが指定されていますが、
別のオプション指定をしたい時は、
option.txt というファイルに指定したいオプションを書いておいて下さい。

 まずはカレントディレクトリにある option.txt がチェックされ、
それがない時は \rpt\d2txt\option.txt がチェックされます。

それもなければ、先述したように -r=0 というオプションが指定されたものとみなされます。

 オプションは、1行に1つづつ書いてもいいですし、1行に複数個を書いてもかまいません(その場合は半角スペースで区切る)。


6. 各ソフトウェアの更新

 下に記すようにして各ソフトウェアを更新した場合は、
更新した後に、rpt_unset.bat を実行してから、
rpt_set.bat を実行し直して下さい。

    

○ xdoc2txt と pandoc は、新しいものを従来のものに上書きするだけで大丈夫です。

 新たに入手した関連ファイル一式をすべて上書きします。

xdoc2txtは \rpt\d2txt というフォルダ、
pandocは \rpt\pandoc というフォルダの下にコピーします。

 d2txt_x.bat とか reference.docx というファイルは、rptパッケージ特有のものなので、それらは削除しないようにして下さい。

    

○ 統計ソフトRは、新しいバージョンを \rpt\R の下にまるごとコピーします。

 現在、R-3.3.2 が入っていますが、
将来、R-3.4.0を導入するのであれば、
R-3.4.0というフォルダを まるごと \rpt\R の下にコピーします。

 R-3.3.2というフォルダは、削除してもしなくても、どちらでもかまいません。

    

○ LaTeX(w32tex)は、\rpt\w32tex というフォルダの下に関連ファイル一式が入っているだけです。それらを新しいものに入れ換えれば、新しいバージョンを使えるようになります。関連ファイルの数が多いので大変ではありますが。

    

○ rubyは、\rpt\ruby というフォルダの下に新しいバージョンをインストールし直すことになります。

 devkitは \rpt\devkit というフォルダの下にインストールして下さい。

 rptパッケージをUSBメモリーなどに入れて持ち歩く場合は、
devkit.rbを書き換える必要があります。

「C:」などのように固定ドライブ名になっているところを弾力的に変化するように書き換えます。

 \rpt\ruby\lib\ruby\site_ruby というディレクトリの下に devkit.rb と devkit.org があるので参考にして下さい。


7. 各種ソフトウェアのライセンスについて

 rptパッケージに入っているのは、いずれもフリーウェアです。

 ただ、一口にフリーウェアといってもライセンスの内容が違うケースがあります。

 正確には、各ソフトウェア関連のドキュメントを参照して下さい。

〜 以上 〜