$0

TSV形式ファイルにおいて、各列に何桁の文字列が何件含まれていたかを一覧表示する。 出力の右側は、具体的な文字列の例を表す。その頻度は薄い文字で括弧内に表す。 その具体例の1番目は、最長の文字列であるが、オプションの-yで指定された場合、その範囲の長さに限定される。 2番目の例は、1番目とは異なるものを探す。できるだけ長い文字列を採用するようにアルゴリズムの設計は試みたが、そうなるとも限らない。

オプション :

-=     : 入力の1行目を、変数名の並びと見なすか。見なした場合、出力の1列目に、列番号の代わりに列名が並ぶ。
-0 str : 頻度が0の場合に与える文字列
-i str : 入力の区切り文字。未指定なら \t すなわちタブ文字。csvなら -i , のように与える。
-u 0   : UTF-8 と通常見なすが、そうせず、バイナリのまま処理をする。
-R 0   : 改行がWindows形式すなわち \r\n であっても、\nしか改行文字と見なさない。(何かこの特殊な用途を想定して実装した。)