$0

TSV形式ファイルにおいて、各列に何桁の文字列が何件含まれていたかを一覧表示する。 出力の右側は、具体的な文字列の例を表す。その頻度は薄い文字で括弧内に表す。 その具体例の1番目は、最長の文字列であるが、オプションの-yで指定された場合、その範囲の長さに限定される。 2番目の例は、1番目とは異なるものを探す。できるだけ長い文字列を採用するようにアルゴリズムの設計は試みたが、そうなるとも限らない。

オプション :

-=     : 入力の1行目を、変数名の並びと見なすか。見なした場合、出力の1列目に、列番号の代わりに列名が並ぶ。
-0 str : 頻度が0の場合に与える文字列
-e RGX : 各セルの文字列長を測る代わりに、正規表現RGXをいくつ持っていたかを測るようにする。 -e '1' や -e '[0-9]$' や -e '大' を指定可能。
-i str : 入力の区切り文字。未指定なら \t すなわちタブ文字。csvなら -i , のように与える。
-u 0   : UTF-8 と通常見なすが、そうせず、バイナリのまま処理をする。
-R 0   : 改行がWindows形式すなわち \r\n であっても、\nしか改行文字と見なさない。(何かこの特殊な用途を想定して実装した。)

--help : このオンラインのヘルプ画面を出力する。 perldoc $0 や man $0 でも可能であろう。

開発メモ : * 半角数値およびピリオドとプラスマイナスさらに半角空白の頻度表の機能を実装したい。 * 平均と分散を算出する機能を入れたい(不偏分散の平方根とするか否か) * 先頭文字または末尾の文字についても一覧にしたい。