もう一つのデータ処理パッケージ(rptパッケージ)について

*全面的に刷新したもう一つのデータ処理パッケージ2017版を公開しました(2017/03/04)。よかったら覗いてみてください。

*更新情報: 2015/06/13 rpt_main.zipを更新。詳細はrptパッケージの更新点を参照。
 2015/05/16 rpt_main.zip, rpt_w32tex.zip, rpt_sample.zipの3つとも更新。

    

「もう一つのデータ処理パッケージ」(rptパッケージ)というのを取りまとめました。MS-Windowsの上で使います。

この特徴・キーワードは、「プログラミングによるオートメーション化」です。ExcelやWordを自動操作することによって、一括処理を実現します。統計ソフトR、組版ソフトLaTeXも利用します。
事務処理の効率化、あるいは仕事の幅をちょっと拡げるヒントになるかもしれません。よかったらダウンロードしてお試し下さい。

また、ruby, 統計解析ソフトR, LaTeX(w32tex)をインストールなしで使うことができます。rptパッケージをUSBメモリーやSDカードに入れておけば、常用パソコン以外のパソコンでも簡単に使い始めることができます。


付属のサンプルで取り上げている処理

 付属のサンプルは、自分自身のために取りまとめたものです。覚えたノウハウを次々と忘れてしまうので、サンプルの形で残すことにしました。そして、面倒がないように、どのサンプルも簡易な同じ操作手順で実行できるようにしました。

 サンプルの動作チェックは、WindowsXP, VISTA, SEVEN, 8.1 で行いました。
 Excelなどのバージョンは 2003, 2007, 2010, 2013 で試しました。

 サンプルでどんな処理を取り上げているか、ざっと書いてみます。


rptパッケージの基本的なキー操作とその背景

 先に掲げたサンプルの処理は、いずれも次のキー操作で行います。2つのステップです。

  1. マイコンピュータ(ビスタ以降ではコンピュータ、エイトではPC)で注目のファイルに焦点を当てます。注目のファイルというのはプログラムファイルです。といっても、いずれも「メモ帳」で読み書きできるテキストファイルです。サンプルでは test.rb.txt のように、ファイル名の最後が「.rb.txt」になっています。
  2. 「送る」メニューを呼び出して、その中から「r rubyの実行」というのを選びます。rptパッケージを導入すると、この「r rubyの実行」が「送る」メニューに追加されます。

 上の2つの操作を行うと、新たにExcelやWordのファイルができたり、htmlやpdfのファイルが作られたりします。Excelの処理でも、Wordの処理でも、統計ソフトRの処理でも、どれでも同じ2つのステップです。

 処理が終了すると、短い警告音がなって、マイコンピュータの状態に戻ります。

 ちょっとしたデモでこれをやってみたところ、「簡単すぎて逆にわけが分からない。納得感が得られない。」と不評でした。

 予め下ごしらえした料理を電子レンジでチンするところだけ見せられても、「おもしろくもなんともない」と感じるのと一緒でしょうか。

 「下ごしらえ」に相当するプログラムの作成は、簡単ではありません。特に、プログラムをゼロから自分で書くためには、それなりの知識と経験が必要になります。

 プログラムといっても、C言語などによる本格的なソフト開発のプログラムとは違います。ずっと簡単なものです。本格的なプログラムと区別して「スクリプト」といったりします。

 とはいえ、なじみのない人にとっては面倒なものに感じられるかもしれません。

 ただ、既にあるスクリプトを自分なりに修正して応用する、というやり方であれば、それほど難しいわけではありません。私が実際にやっているのは、ほとんどが《「既存のスクリプトを切りばり・修正して実行する》です。

 この方法の利点は、大量のデータを扱うとしても苦にならないこと、同じような処理の繰り返しが簡単になることです。複雑なキー操作の手順を忘れてしまっても(手順はプログラムとして書いてあるので)ともかくも実行して結果が出せる、というのも利点でしょうか。

 例えば、ワード文書に含まれている表をすべてエクセルに書き出す場合、1つだけのワード文書を扱うのも、100個のワード文書を処理するのも、基本的に手間は同じです。100個を扱うからといって、同じ手作業を100回繰り返すわけではありません。

 一方、1回こっきりの処理のためにわざわざプログラムを書くのは、むしろ時間がかかります。通常のキー操作・マウス操作で対応する方がいいと思います。

 要は、場合に応じて使い分けるのが一番ということになります。その「使い分け」のための選択肢を提供するのが「もう一つのデータ処理パッケージ」です。


rptパッケージのダウンロード

 このパッケージを使うための方法を記します。

 まず、次の3つの圧縮ファイルをダウンロードします。

 ハードディスク、USBメモリー、あるいはSDカードに保存して下さい。どのドライブでもいいのですが、できればルートディレクトリ直下に置いて、その上で解凍します。

 解凍すると rpt および rpt_sample の2つのフォルダができるはずです。rpt というフォルダは、必ずルートディレクトリ直下に置くようにします。つまり「C:\rpt」とか「F:\rpt」などになるようにします。もし解凍した場所がルートディレクトリ直下でない時は、ルートディレクトリ直下に移動させて下さい。

 USBメモリーやSDカードに置くと、常用パソコン以外のパソコンにも装着して簡単に使えます。

 念のため md5, sha-1 の情報を掲載しておきます。ダウンロードしたzip圧縮ファイルが元本と一致するかどうかをチェックしたい時に利用して下さい。


rptパッケージのインストールとアンインストール

 rptというフォルダの下にある rpt_set.bat を実行すると、「送る」メニューに関連項目が登録されます。これで rpt_sample というフォルダの下にあるプログラムを実行できるようになります。

 rpt_set.bat を実行するには、マイコンピュータでこのバッチコマンドに焦点を当ててエンターキーを押します。そうすると実行されます。

 rpt_unset.bat を実行すれば、関連の「送る」メニューの項目が消去されます。「rptパッケージをもう使わない」という時に実行して下さい。

 あるいは、パッケージをUSBメモリーなどに入れている場合であって、そのUSBメモリーをパソコンから取り外す時は、念のため取り外す前に rpt_unset.bat を実行して下さい。実行し忘れても実害はありませんが。


各種ファイルのテキストへの変換

 rptパッケージを導入すると、「送る」メニューに「t textへの変換」が追加されます。

 エクセルやワードに限らず、一太郎、パワーポイント、PDFなどのファイルに焦点を当ててこの「t textへの変換」を選ぶと、変換結果が test.jtd.txt とか test.pptx.txt などとして書き出されます。これは、xdoc2txtというコマンドを呼び出す形で実現しています。

 OCR機能はないので、pdfなどの画像化された文字は変換できませんが、変換が迅速で便利です。


 rptというフォルダの下にある readme.txt に、もう少し詳しい情報が書かれていますので参考にして下さい。

 readme.txtをWeb上で閲覧したい方は、 rptパッケージについてをお読み下さい。

rptパッケージ利用時のちょっとテクニカルな話というのも掲載しています。

 付属のサンプルの簡単な説明(メモ書き)を閲覧したい方は、 rptパッケージのサンプル・スクリプトに関するメモ書きをご覧ください。

 以上です。

 よかったらお試し下さい。


トップページへ