#!/usr/bin/perl
use 5.001 ; use strict ; use warnings ; 
use Getopt::Std ; getopts '@:?:=:c:d:f:gr,:' , \my %o ; 
use PerlIO::gzip ;
use Term::ANSIColor qw[ :constants color ] ; $Term::ANSIColor::AUTORESET = 1 ;
use autodie 'open' ; # <-- - æ„å‘³ã‚’ç‚ºã—ã¦ã„ã‚‹ã‹ã‚’ç¢ºèªã—ãŸã„ã€‚

sub cyc_rep ( ) ;
sub main ( ) ; 
sub mainC ( ) ;
sub closing ( ) ;  

$/ = "\r\n" if $o{r} ;
$o{d} //= 1 ; # å‡ºåŠ›ãƒ•ã‚¡ã‚¤ãƒ«ã®åå‰ã«ä»˜åŠ ã™ã‚‹æ•°ã®æœ€å°ã®æ¡æ•°ã®æŒ‡å®šã€‚
my $per_cyc = $o{'@'} // 1e6 ;
my ($time00, $time0)  = (time) x 2  ; 
my $bodyname = $o{f} // 'out' ; # å‡ºåŠ›ã™ã‚‹ãƒ•ã‚¡ã‚¤ãƒ«ç¾¤ã®åå‰ã¯ã€ã“ã‚Œã«ã€ãƒ”ãƒªã‚ªãƒ‰ã¨æ•°ã¨ãªã‚‹ã€‚
my $isep = do { $o{','} //= $ENV{isep} // "\t" ; eval qq[qq[$o{','}]] } ; # å…¥åŠ›ã®åŒºåˆ‡ã‚Šæ–‡å—

# ã“ã“ã‹ã‚‰4å€‹ã®å¤‰æ•°ã¯ -c ãŒæŒ‡å®šã•ã‚ŒãŸæ™‚ã«å¿…è¦ã¨ãªã‚‹ã€‚-c ãŒç„¡ã‘ã‚Œã°ä½¿ã‚ã‚Œãªã„å¤‰æ•°ã€‚
my (%seen,%ofh) ; # ç€ç›®ã—ãŸå€¤ã‚’è¦‹ãŸã‹ã€ãã—ã¦ãã‚Œã«å¯¾å¿œã™ã‚‹ãƒ•ã‚¡ã‚¤ãƒ«ã®ãƒ‡ã‚¹ã‚¯ãƒªãƒ—ã‚¿
my $fc = 0 ; # ç•°ãªã‚‹æ³¨ç›®åˆ—ã®å€‹æ•°
my $fn = 0 ; # ç”Ÿæˆå‡ºåŠ›ãƒ•ã‚¡ã‚¤ãƒ«æ•°
my $status = 0 ; # è¿”ã™ã‚³ãƒ¼ãƒ‰ã€‚Ctrl+Cã§ 130 ã¨ã™ã‚‹ã€‚ãªãŠã€ãƒ•ã‚¡ã‚¤ãƒ«ã‚ªãƒ¼ãƒ—ãƒ³ã®ã‚¨ãƒ©ãƒ¼ã¯ãŠãã‚‰ã255ã¨ãªã‚‹ã€‚

unless ( $o{c} ) { main }
else { mainC ; closing }
exit ;

sub main ( ) { 
  my @ofh ; 
  my $cols = 0 ;  # åˆ—ã®å€‹æ•°ã‚’æ ¼ç´ã€‚æœ€åˆã®è¡Œã‚’èªã¿å–ã£ãŸæ™‚ç‚¹ã§ç¢ºå®šã€‚
  my $layer = $o{g} ? '>:gzip' : '>' ; # "ãƒ¬ã‚¤ãƒ¤ãƒ¼" ã®æŒ‡å®š
  my $empty = $o{e} // '?' ; # åˆ—ãŒè¶³ã‚Šãªã„å ´åˆã«æ ¼ç´ã™ã‚‹æ–‡å—åˆ—
  while ( <> ) {
    chomp ; 
    my @F = split /$isep/ , $_ , $cols || -1  ; # <-- é•·ã„ã‚‚ã®ã‚’æ¨ã¦ã‚‹ã“ã¨ã®å†…å®¹ã«ã™ã‚‹ãŸã‚ || ã‚’ä½¿ã†ã€‚ 

    if ($.==1) { 
    	for ( @F ){ 
        $cols ++ ; 
        my $num = sprintf "%0$o{d}d" , $cols ; 
        $num .= '.gz' if $o{g} ;
        open my $ofh , $layer , "$bodyname.$num" or die $! ; 
        push @ofh , $ofh ; 
    	}
    } 
    print {$_} shift @F // $empty , "\n" for @ofh ; # <-- ãã‚Œãžã‚Œã®ãƒ•ã‚¡ã‚¤ãƒ«ã«æ›¸ãè¾¼ã¿

    cyc_rep if $per_cyc && $. % $per_cyc == 0 ; 
  }
  grep { close $_ }  @ofh  ;
}


sub mainC ( ) { 
  my $layer = $o{g} ? '>:gzip' : '>' ; # å‡ºåŠ›ã®IOãƒ¬ã‚¤ãƒ¤ãƒ¼ã®æŒ‡å®š
  my $tail = $o{g} ? '.gz' : '' ; # å‡ºåŠ›ãƒ•ã‚¡ã‚¤ãƒ«åã®æœ«å°¾
  my $header = <> if $o{'='} ; 
  my $loc =  do { $o{c}//=1 ; $o{c} >= 0 ? $o{c} - 1 : $o{c} }  ; # ã©ã®åˆ—ã‚’å–ã‚Šå‡ºã™ã‹
  my $maxfc = $o{m} // 200 ; 
  my $residual = 'residual' ; # æœ€å¤§å€‹æ•°ã«é”ã—ãŸæ™‚ã«ä½¿ã†æ–‡å—åˆ—<-- - ã“ã®æ–‡å—åˆ—ã¯æŒ‡å®šå¯èƒ½ã¨ã—ãŸã„ã€‚

  $SIG{INT} = sub { $status = 130 ; closing }  ; 

  while ( <> ) { 
      chomp ; 
      my $id = ( split /$isep/, $_ , -1 ) [ $loc ] // 'undef' ; # <-- - ã“ã®undef ã® å ´åˆã®æ–‡å—åˆ—ã¯æŒ‡å®šå¯èƒ½ã¨ã—ãŸã„ã€‚
      unless ( $seen{$id} ++ ) { 
          $fc ++ ; 

          if ( $fc >= $maxfc ) { 
            print " " x 40 . "$fc $id\r" ; 
            $id = $residual ; 
          }

          unless ( exists $ofh{$id} ) { 
            open my $ofh , $layer , "$bodyname$id$tail" ;
            $fn ++ ; 
            $ofh{ $id } = $ofh ;
            print {$ofh} $header if defined $header ; 
          }
      }
      my $ofh = exists $ofh{$id} ? $ofh { $id } : $ofh { $residual } ; # $ofh{$id}//$ofh{$residual}ã¯ã†ã¾ãã„ã‹ãšã€‚
      print {$ofh} $_ . "\n" ;
      cyc_rep if $per_cyc && $. % $per_cyc == 0 ; 
  }
}

sub closing ( ) { 
  use FindBin '$Script' ;
  my $num = $. ; 
  $num =~ s/(?<=\d)(?=(\d\d\d)+($|\D))/,/g ; # 3æ¡æ¯Žã«ã‚³ãƒ³ãƒžã§åŒºåˆ‡ã‚‹
  my $sec = time - $time00 ; 
  print STDERR CYAN "$num lines processed. $fc different remarked column values. $fn output files. ($Script ; $sec sec.)" ; 
  close $_ for values %ofh ; 
  exit $status ; 
}



sub cyc_rep ( ) {
  use FindBin '$Script' ;
  $| = 1 ; 
  my $num = $. ; 
  $num =~ s/(?<=\d)(?=(\d\d\d)+($|\D))/,/g ; # 3æ¡æ¯Žã«ã‚³ãƒ³ãƒžã§åŒºåˆ‡ã‚‹
  print STDERR GREEN $num , ":\t" , sprintf "%02d:%02d:%02d" , ( localtime )[2,1,0] ;  #  <-- æ¨™æº–å‡ºåŠ›ã«æ›¸è¾¼ã¿
  print STDERR "\t" , GREEN  time - $time0 , " sec.\t($Script)" ; 
  print STDERR "\t" , BLUE $_ ; 
  $time0 = time ;
  print STDERR "\n" ;
}


## ãƒ˜ãƒ«ãƒ—ã®æ‰±ã„
sub VERSION_MESSAGE {}
sub HELP_MESSAGE {
    use FindBin qw[ $Script ] ; 
    $ARGV[1] //= '' ;
    open my $FH , '<' , $0 ;
    while(<$FH>){
        s/\$0/$Script/g ;
        print $_ if s/^=head1// .. s/^=cut// and $ARGV[1] =~ /^o(p(t(i(o(ns?)?)?)?)?)?$/i ? m/^\s+\-/ : 1;
    }
    close $FH ;
    exit 0 ;
}

=encoding utf8

=head1 

  $0 -f out < input  # è¡¨å½¢å¼ã®å…¥åŠ›ã‚’åˆ—ã”ã¨ã«ã€ç¸¦ã«ã°ã‚‰ã°ã‚‰ã®ãƒ•ã‚¡ã‚¤ãƒ«ã«ã™ã‚‹ã€‚
  $0 -c colnum -f out < input # æ³¨ç›®åˆ—ã®å€¤ã”ã¨ã«åˆ†é¡žã—ã¦ã€ã°ã‚‰ã°ã‚‰ã®ãƒ•ã‚¡ã‚¤ãƒ«ã¸ã€‚

 å‹•ä½œ : 
  å…¥åŠ›ãƒ•ã‚¡ã‚¤ãƒ« file ã‚’ã‚¿ãƒ–åŒºåˆ‡ã‚Šã®tsvãƒ•ã‚¡ã‚¤ãƒ«ã§ã‚ã‚‹ã¨è¦‹ãªã™ã€‚
  -c ãŒç„¡ã„å ´åˆ ã«ã¯ã€ç¬¬nåˆ—ã®å€¤ã‚’å…ˆé è¡Œã‹ã‚‰æœ€çµ‚è¡Œã¾ã§ã€file.n ã®ã‚ˆã†ãªãƒ•ã‚¡ã‚¤ãƒ«åã§ä¿å˜ã™ã‚‹ã€‚
  -c ãŒã‚ã‚‹å ´åˆã¯ã€ãã®æ•°ã®ä½ç½®ã®åˆ—ã®å€¤ã«å¿œã˜ã¦ã€å…¥åŠ›å„è¡Œã‚’åˆ†é¡žã—(æ¨ªåˆ†å‰²ã—)ã€å„ãƒ•ã‚¡ã‚¤ãƒ«ã«æ ¼ç´ã€‚

 ã‚ªãƒ—ã‚·ãƒ§ãƒ³: 

  -d num : æ¡æ•°ã‚’æŒ‡å®šã€‚ç”Ÿæˆã•ã‚Œã‚‹ãƒ•ã‚¡ã‚¤ãƒ«ã®åå‰ã«ä½¿ã‚ã‚Œã‚‹æ•°ã‚’ã‚¼ãƒåŸ‹ã‚ã«ã™ã‚‹ã¨ãã«ä¾¿åˆ©ã€‚
  -f str : å‡ºåŠ›ã®ãƒ•ã‚¡ã‚¤ãƒ«ç¾¤ã®å…±é€šã™ã‚‹éƒ¨åˆ†ã®æ–‡å—åˆ—ã‚’æŒ‡å®šã™ã‚‹ã€‚æœªæŒ‡å®šãªã‚‰ "out"ã€‚
  -g    ; gzip å½¢å¼ã§å‡ºåŠ›ã™ã‚‹ã€‚

  -m num : å‡ºåŠ›ã™ã‚‹ãƒ•ã‚¡ã‚¤ãƒ«ã®å€‹æ•°ã®è¨å®šã€‚æœªæŒ‡å®šãªã‚‰ 200 ã€‚
  -, str : å…¥åŠ›ã®åŒºåˆ‡ã‚Šæ–‡å—ã®æŒ‡å®šã€‚æœªæŒ‡å®šãªã‚‰ã€\t ã¨ãªã‚‹ã€‚
  -r : å…¥åŠ›ã®æ”¹è¡Œã‚³ãƒ¼ãƒ‰ãŒã€€\r\n ã§ã‚ã‚‹ã“ã¨ã®æŒ‡å®šã€‚
  -@ num :ã€€ä½•è¡Œã”ã¨ã«é€”ä¸ã®ãƒ¬ãƒãƒ¼ãƒˆã‚’è¿”ã™ã‹ã‚’æŒ‡å®šã™ã‚‹ã€‚æœªæŒ‡å®šãªã‚‰10ä¸‡è¡Œã€‚
  -'?' str ; åˆ—ãŒå°‘ãªã™ãŽã‚‹è¡ŒãŒã‚ã£ãŸå ´åˆã«ã€å‡ºåŠ›å…ˆã«æ ¼ç´ã™ã‚‹æ–‡å—ã‚’æŒ‡å®šã€‚æœªæŒ‡å®šãªã‚‰?ã€‚

  -=   ; å…ˆé ãŒãƒ˜ãƒƒãƒ€è¡Œã§å§‹ã¾ã‚‹ã¨ä»®å®šã™ã‚‹ã€‚å‡ºåŠ›ã®å„ãƒ•ã‚¡ã‚¤ãƒ«ã®ä¸€è¡Œç›®ãŒå…¥åŠ›ãƒ•ã‚¡ã‚¤ãƒ«ã®ä¸€è¡Œç›®ã¨ãªã‚‹ã€‚(-cã‚’ä½¿ã†æ™‚æŒ™å‹•ãŒå¤‰ã‚ã‚‹ã€‚)

  --help : ã“ã® $0 ã®ãƒ˜ãƒ«ãƒ—ãƒ¡ãƒƒã‚»ãƒ¼ã‚¸ã‚’å‡ºã™ã€‚  perldoc -t $0 | cat ã§ã‚‚ã»ã¼åŒã˜ã€‚
  --help opt : ã‚ªãƒ—ã‚·ãƒ§ãƒ³ã®ã¿ã®ãƒ˜ãƒ«ãƒ—ã‚’å‡ºã™ã€‚optä»¥å¤–ã§ã‚‚ options ã¨å…ˆé ãŒ1æ–‡å—ä»¥ä¸Šä¸€è‡´ã™ã‚Œã°è‰¯ã„ã€‚

  ç’°å¢ƒå¤‰æ•° : 
    $isep : å…¥åŠ›ã«ã¤ã„ã¦ã®åŒºåˆ‡ã‚Šæ–‡å—ã®æŒ‡å®šã€‚æœªæŒ‡å®šãªã‚‰ã€ã‚¿ãƒ–æ–‡å—ã€‚  

 æ³¨æ„ç‚¹ : 
     åŒæ™‚ã«å¤šæ•°ã®æ›¸è¾¼ãƒ•ã‚¡ã‚¤ãƒ«ã‚’é–‹ãã®ã§ã€ulimit -n ã§ãã®æ•°ã‚’ç¢ºèªã™ã‚‹ã“ã¨ã€‚

=cut