当サイトにおける python関連記事の一覧を列挙します。
pythonのpandas, scipy, numpyなどを使って、
簡単な統計処理を試みます。
日本語MS-Windowsの環境下で、Excelファイルを素材にします。
文字コードは cp932 (Shift_JISの拡張版)を前提にします。
こだわったのは次の2点。
mean()
、データの要約を得る describe()
を利用。 統計解析ソフトRをpythonから利用する場合、
rpy2 とか pyper というライブラリを利用できます。
ただ、マルチバイト文字の日本語を扱おうとすると苦労します。
そこで、rpy2 を利用しつつ、日本語を扱いやすくするため
pyrcmd.py を作りました。
また、統計処理した結果をmarkdown経由でhtmlなどに変換するのに
便利そうな関数をpyrcmd.pyに組み込みました。
それについて解説しています。
pythonで定番の単純な集計を行う目的で prast.py を自作しました。
統計検定で物足りない点も補います。
カイ二乗検定で残差関連の情報が取得できないとか、
平均値の差の検定(t検定)で片側検定を指定するオプションがないなどを補足。
pandocで生成したdocxファイルを python-docx で加工処理します。
Wordを起動することはありません。
Windows以外の環境でも使えるとおもいます。
html, pptx の出力にも対応。
html出力時は、見出しの行に機械的にID属性を付加します。
pandocとpythonの組み合わせによるWord文書の作成